본문 바로가기

데이터 큐레이션

(8)
Week13) 데이터 큐레이션 실습 : Preservation Action 데이터 보존하기 데이터 이전 (migration) + 재평가 (re-appraisal) 1. 데이터 보존하기 데이터의 권위적인 상태 유지를 위해 장기 보존과 유지를 보장하는 과정 목적 : 데이터 무결성 진실성 신뢰성 유지 주요 활동 데이터 정리하기 확인하기 보존 메타데이터 부여 표현 정보 부여 수용 가능한 데이터 구조 또는 파일 형식 보장 2. 이전 Migration 데이터 보존 방식의 일종 데이터 장기적 보존을 위해 필요한 활동 비정기적 활동 데이터 이전은 미디어 사용 만료, 기술적 지원 만료 등의 이유로 이전하는 것 3. 보존의 목표 authenticity 진실성 데이터 조작, 위조, 대체되지 않음 원본 유지 integrity 무결성 추가적인 조작이 없는 상태 longevity 지속성 현재 미래 모두 데이터 이용 가..
Week11) 데이터 큐레이션 실습 : Determining Data to maintain 데이터 평가 및 선택 1. 평가와 선택 1.1 appraise & select 어떤 데이터와 디지털 자료를 장기적으로 보존할 것인지 어떤 것을 버릴 것인지 결정하는 기준을 개발하고 그것을 적용하는 과정 1.2 reappraise & dispose 평가와 선택의 연속적 활동 재평가 : 보존 단계에서 기준을 충족하지 못한 경우 재평가됨 처분 : 평가 결과 → 선택되지 못한 것은 처분 과정을 거침 → transfer or destory / 평가 과정의 potential result (평가 결과가 될 수 있는 것) 1.3 주요활동 평가와 선택에 대한 정책 개발, 문서화, 적용 전담 공동체 정하기 보존 데이터 특징 파악 유지 기간 결정 평가 기준 개발 평가한 데이터 유지 여부 결정 1.4 평가란? 어떤 정보 자료의 중요도를 결정하는 ..
Week10) 데이터 큐레이션 실습 : Creating Data 데이터 생산하기 1. 데이터 생산 및 수집하기 과학자, 학자, 개인들이 데이터 생산 이 데이터들은 큐레이션과 미래의 공유 및 재사용을 고려하여 생산되어야 함 1.1 데이터 생산 및 수집의 주요 활동 데이터 생산시 관리적, 설명적, 구조적, 기술적 메타데이터 부여 문서화된 수집 정책을 바탕으로 데이터 생산자, 아카이브 등으로부터 데이터 수집시에도 관련 메타데이터 부여 데이터 + 관련 설명 및 표현 정보 생산 데이터를 외부로부터 수집하여 → 큐레이션 될 수 있는 상태로 준비 1.2 데이터 생산 및 수집의 구체적 활동 수집 및 생산 관련 정책 개발 및 문서화 생산자들이 큐레이션 친화적 데이터를 생산하도록 함 구조화 : 표준 데이터 형식, 파일 포맷에 따라 데이터를 생산하여 오픈 소스나 문서화된 프로그램으로 처리될 수 있게 함..
Week9) 데이터 큐레이션 실습 : Designing Data Week9) 데이터 큐레이션 실습 : Designing Data 이번 챕터에서는 DCC 데이터 생애주기 모델의 첫번째 단계인 conceptualize 단계에 초점을 맞춘다. 개념화 단계에서 디지털 큐레이션 과정과 결과를 고려하여 연구, 디지털화, 생산 활동을 계획하는 것으로 잘 디자인된 프로젝트는 큐레이션 전 단계들이 수월하게 진행될 수 있다. Conceptualize : 수집 및 저장 방법을 고려하여 데이터 생산을 어떻게 할지 생각하고 계획하는 과정 1. planning 을 위한 주요 활동 큐레이션이 용이한 파일 형식으로 데이터를 수집 및 저장 지속적 관리와 사용을 위해 데이터 수집 시 충분한 정보 기록 파일 세심하게 관리 적절한 저장 매체에 데이터 저장 데이터를 생산하고 관리하는데 이용되는 시스템을 ..
Week5) 데이터 큐레이션 실습 : 큐레이션의 특징 DDC 큐레이션 생애 주기 모델 상호의존성(interdependent) : 각 컴포넌트들이 독립적으로 존재하는 것이 아니라 이웃 컴포넌트들과 밀접한 연관을 가지며 의존한다. 큐레이트와 보존(preserve) 관리(administration)와 운영(management) 필요 : 큐레이트와 보존을 위해 관리와 운영이 필수적으로 요구된다. 디지털 보존 목표 데이터, 디지털 자료, 데이터베이스가 그들의 생산과 초기 관리에 사용되었던 소프트웨어나 하드웨어의 수명 이상으로 미래에도 지속적으로 접근 가능하도록 보장하는 것 데이터를 다양한 형태로 계속해서 접근이 가능하도록 관리 자료의 지속적 접근성을 장기간 보장하기 위한 모든 활동 디지털 큐레이션 디지털 보존보다 상위 개념 적극적인 데이터 관리 디지털 보존은 디지털..
Week4) 데이터 큐레이션 실습 : 데이터 정의 Week4) 데이터 큐레이션 실습 : 데이터 정의 데이터 큐레이션의 대상 디지털 형태의 모든 정보 simple digital object : 문서, 그림, 음성 파일 complex digital object : 웹 페이지 (단순 자료의 복합물) 메타데이터 데이터 베이스 : 시스템에 저장된 구조화된 데이터 혹은 기록의 모음 디지털 문화 유산으로서의 데이터 UNESCO : 디지털 상태로 생성된 정보 + 아날로그가 디지털로 형태 변환된 정보 전자출판물 : 최근의 논문들은 대부분 전자출판물로 나옴 (article pre-print) / 저널이 논문을 받아 페이퍼형식으로 출판 ** ArchiveX.org : 논문의 preprint 버전(마지막으로 수정한 버전)을 공유-논문이 나오기 전에 학자들간 공유 및 토론 온..
Week2 ) 데이터 큐레이션 실습 : 데이터 큐레이션의 동향 Week 2 : The Chaning Landscape Lecture 2-1 1. e-science의 최근 동향 e-science =cyberscholarship 데이터 큐레이션의 중요성 증대 과학, 학문, 연구 분야 뿐만 아니라 정부 기관들도 데이터를 활용하는 업무가 많아졌기 때문에 데이터 큐레이션이 중요해졌다. 이러한 새로운 업무 방식은 데이터 큐레이션을 지원하는 사이버 인프라의 필요성을 증대시켰다. 학문 분야는 이미 잠재적으로 data-driven 한 방식을 취하고 있으며 이 방식이 확장되는 중이다. 사이버 학문은 네트워크, 데이터, 학문간 협업 등을 나타내기 위한 용어이다. cyberscholarship => data curation + cyber-infrastructure (tech + huma..
Week 1) 데이터 큐레이션 실습 Week 1 : Course Introduction Lecture 1-1 더보기 1. Evaluation No 시험~~!! 매주 실습을 잘해서 냅시당! 영어 수업이지만 영어가 어렵다면 한국말로 작성해도 괜찮습니다. 2. Procedure of online class Lecture 1-2 1. 디지털 데이터 큐레이션의 초기 정의 Initial Definition 데이터란 무엇인가? raw material 정보를 만들어 내는 것 의도적으로 아주 광범위하게 사용되는 초기 정의 : any information in binary digital form 디지털 큐레이션이란? the management and preservation of digital materials to ensure accessibility ov..