Week 3 : Conceptual Models
모델, 이론 등은 실험 결과를 해석(interpret)하는데 도움을 주는 것으로 이번 장에서는 데이터 큐레이션의 개념적 모델에 대해 공부합니다.
1. 개념적 모델이란?
- 개념적 모델을 사용하여 효율적인 디지털 큐레이션을 할 수 있다.
- 개념적 모델은 어떤 문제를 해결하기 위한 가이드라인을 제공하고 현상을 이해하는데 도움을 준다.
- 디지털 큐레이션에 사용되는 개념적 모델 3가지
2. Data Curation Continum
- 호주, 모나쉬 대학교에서 개발된 모델
- 정보의 연속성 (continum)에 따라 데이터 큐레이션을 한다.
- 시공간적인 측면 뿐만 아니라 큐레이션이 발생하는 문맥에 대해 설명할 수 있다.
- 기존의 전통적인 정보 수명주기 모델에 대한 요구사항을 더 넓은 관점으로 분석할 수 있다.
- data curation continum component
- Object
- Management
- Access
3. Open Archival Information System (OAIS) Reference Model
- 가장 많이 알려진 아카이브 모델
OAIS Reference Model
- 디지털, 기술적 아카이브 시스템 도입 및 구축시 사용하는 모델
- 프로듀서 (생산자)가 SIP (Submission Information Package)를 제공한다.
- 컨슈머 (사용자)가 DIP (Description Information Packag)를 받는다.
- 상자 내부는 정보 아카이브 내부 상황을 개념적 모델링 한 것이다.
- 특정 아카이브 시스템에 맞게 데이터 포맷을 Ingest하고 데이터에 대한 설명을 추가하여 Archival Information Package로 만든다.
- AIP를 아카이브 저장소에 저장하고, 데이터 관리 및 아카이브 관리를 한다. (표준화, 정리, 등)
- AIP에 접근할 수 있도록 인터페이스를 제공하여 사용자들이 쿼리를 날리고, 결과를 얻고, 주문할 수 있도록 한다.
- AIP를 DIP로 만들어 사용자에게 전달하여 실제 사용 가능한 형태로 전달한다.
OAIS Functions
- Ingest : 생산자에 의해 정보가 수용되는 기능으로, 아카이브 내에서 저장 및 관리가 될 수 있도록 정보를 준비하는 것이다.
- Archival storage : 아카이브 상태가 안정적이고, 관리, 유지, 검색 가능한 형태로 관리하는 것을 말한다.
- Data Management : 데이터 접근, 업데이트를 지원하는 것으로 AIP를 DIP로 만드는 것을 말한다.
- Administration : 매일 아카이브의 기능 및 운영을 관리하는 것이다.
- Access : 사용자가 DIP를 식별하고 얻을 수 있도록 돕는 인터페이스를 제공하는 것이다.
OAIS Base Concept
- Actor : 인간, 컴퓨터 시스템이 생산자, 관리자, 소비자 역할을 한다.
- 소비자: 개인, 단체, 컴퓨터 시스템으로 아카이브에 보존하기 위해 정보를 디지털화한다.
- 관리자 : 아카이브 내부의 기능을 관리하고, 수행하고, 범위를 정의하고, 정책을 개발한다.
- 소비자 : 아카이브에 보존된 정보를 사용하려고 하는 개인, 집단, 시스템을 말한다.
- Objects
- Submission Information Package (SIP) : 생산자가 아카이브에 저장하기 위해 만드는 객체
- Archival Information Package (AIP) : 아카이브에서 관리되기 위한 객체
- Dissemination Information Package (DIP) : 생산자에게 전달되기 위한 객체
- Information Pacakge = digital object + metadata + packaging
3. Digital Curation Centre (DCC) Curation Lifecycle Model
DCC Curation Model
- 디지털 큐레이션을 이루는 액션의 개요
- 그래픽 형태로 디지털 큐레이션을 나타낸다.
- 아키이브 시스템 외부에서 발생하는 활동들을 포괄한다. (입출력 전후도 포함)
- 아카이브 보존 자체보다는 데이터 큐레이션에 초점을 맞춘다.
- 여러 세트의 액션을 포함하여 직선적인 접근 방식이 아닌 더 넓은 관점을 제공한다.
- Full lifecycle actions
- sequential lifecycle actions
- occasional lifecycle actions
- conceptualise 어떤 것을 표현하고, 어떻게 저장하고, 어떻게 사용할 수 있게 할 것인지 개념화
- 디지털 객체를 생산하거나 받음
- appraise & select 어떤 것을 아카이브에 넣을 지 평가하고 선택
- ingest 데이터를 아카이브에 가져옴 -> 적절하지 않으면 재평가해서 선택 단계로 돌리거나 버림
- preservation action , 적절한 곳으로 보존한 수 있도록 migrate하기도 함
- 시스템에 저장
- ingest + preservation + store (OAIS model)
- access & use & reuse
- trasnform 사용 및 재사용을 통해 데이터에 변형이 일어날 수도 있음 이렇게 새롭게 변형된 데이터는 또 다시 데이터 큐레이션 과정을 거쳐 보존, 사용, 관리 되어야 함
Full Lifecycle Actions
- 성공적인 큐레이션 과정에 필수적인 요소
- 큐레이션 되어야 하는 모델의 중심으로 강조함
- sequential action에 적용됨
- 4개의 중앙 내부 링(주요요소)
- description & representation information
- preservation planning
- community watch and participation
- curate and preseve
Sequential Lifecycle Actions
- 주요 액션을 나타내는 외부 붉은색 링을 나타냄
- 데이터 생성부터 궁긍적인 사용까지 전체적인 라이프라이클 움직임에 필요한 주요 액션
- 단순히 일직선으로 끝나는 것이 아니라 계속적으로 반복되는 형태
- conceptualize, create, appraise, ingest, presercation, store, access use, transform
Occasional Actions
- 특정 상황을 마주했을 때 발생하는 액션
- 모든 데이터에 적용되는 것 아님
- 예를 들어 재평가되거나 버려지는 액션
- dispose, reappraise
- migrate는 책에서는 occasional에 포함되지 않지만 교수님 견해는 포함되어야 한다는 것
4. OAIS vs. DDC
- DCC의 ingest -> preservation action -> store 부분은 OAIS 모델과 거의 유사함 (공통 핵심 부분)
- DCC는 시스템 외부에서 발생하는 액션도 다루기 때문에 OAIS보다 넓은 관점의 모델
- DCC는 조금 더 다양한 분야에 적용되는 모델
References
- 2021-1 성균관대학교 문헌정보학과 <데이터 큐레이션 실습>, 김영식 교수님 수업을 들으며 정리한 내용입니다.
- 2021.03.09
'컴퓨터 공학 > 데이터 큐레이션' 카테고리의 다른 글
Week6) 데이터 큐레이션 실습 : description & representation information (0) | 2021.03.29 |
---|---|
Week5) 데이터 큐레이션 실습 : 큐레이션의 특징 (0) | 2021.03.22 |
Week4) 데이터 큐레이션 실습 : 데이터 정의 (0) | 2021.03.16 |
Week2 ) 데이터 큐레이션 실습 : 데이터 큐레이션의 동향 (0) | 2021.03.02 |
Week 1) 데이터 큐레이션 실습 (0) | 2021.02.23 |