Week4) 데이터 큐레이션 실습 : 데이터 정의
데이터
큐레이션의 대상
- 디지털 형태의 모든 정보
- simple digital object : 문서, 그림, 음성 파일
- complex digital object : 웹 페이지 (단순 자료의 복합물)
- 메타데이터
- 데이터 베이스 : 시스템에 저장된 구조화된 데이터 혹은 기록의 모음
디지털 문화 유산으로서의 데이터
- UNESCO : 디지털 상태로 생성된 정보 + 아날로그가 디지털로 형태 변환된 정보
- 전자출판물 : 최근의 논문들은 대부분 전자출판물로 나옴 (article pre-print) / 저널이 논문을 받아 페이퍼형식으로 출판 ** ArchiveX.org : 논문의 preprint 버전(마지막으로 수정한 버전)을 공유-논문이 나오기 전에 학자들간 공유 및 토론
- 온라인논문 : 예전에는 특정 저널 또는 출판사가 독점했지만 요즘은 종이 형태의 저널이 줄었고, 일반 학자 그룹에서 온라인 논문 출판 가능한 저널을 만들어내 온라인 논문이 활성화 됨 ex) information research
- 조직 혹은 개인의 기록물, 과학 사회 연구 데이터, 학습 자료, 소프트웨어, 디지털 예술 작품
디지털 자료의 종류
- 디지털 형태로 생산된 자료 (born-digital)
- 디지털 형태로 변환됨 자료 (digitized material)
- 두 형태의 자료 모두 데이터 큐레이션 관점에서는 차이가 없고, 모두 생산 변환 평가의 과정을 갖는다.
데이터 및 디지털 자료 (연구로서의 데이터의 종류)
- 개별 연구의 수집 자료 (개별 실험 자료)
- 연구 집단이 함께 모은 자료 ex) 유전자 염기서열 분석 (genom-sequence / 다양한 생물의 유전자 지도를 만드는 프로젝트)
- 참고 자료 / 사전적 자료 ex) sloan sky survey : 천체에 관한 사진 (디지털 자료) 수집하여 개별 연구자에게 공유 (한기관이 특정 목적을 가지고 연구자들에게 제공하는 것 - 참고자료)
메타데이터도 데이터로 간주
- 데이터의 정의, 수집 배경, 데이터 구조, 데이터간의 관계, 데이터 생성 기원 등
- 데이터 활용 가치를 높임
- 데이터 이해 증진
- 쉽게 확인 및 검색 가능
- 데이터 연결 -> 데이터간 상호 소통 가능 (데이터 중심적 연구 가능)
데이터 베이스
- 컴퓨터 시스템에 저장된 구조화된 데이터 혹은 기록의 모음
- 정부 및 회사에서 대량의 데이터를 저장 및 관리
- 데이터 큐레이션 측면에서 문제를 내포 -> 단순 저장은 변화하는 내용에 능동적 대처가 어려움
새로운 종류의 데이터
- 데이터, 디지털 자료, 데이터베이스
- 메타데이터, 관련 문서
- 데이터 시각화 자료 (변형된 데이터 자료)
- 작업 흐름 ex) open data framework -> 데이터 이해 증진
- 새로운 형식의 디지털 문화 유산 ex) 트위터, 페이스북 등 SNS
- 모두 큐레이션의 대상
- 이론 및 실례의 개발 필요
'컴퓨터 공학 > 데이터 큐레이션' 카테고리의 다른 글
Week6) 데이터 큐레이션 실습 : description & representation information (0) | 2021.03.29 |
---|---|
Week5) 데이터 큐레이션 실습 : 큐레이션의 특징 (0) | 2021.03.22 |
Week3) 데이터 큐레이션 실습 : 데이터 큐레이션의 개념적 모델 (0) | 2021.03.09 |
Week2 ) 데이터 큐레이션 실습 : 데이터 큐레이션의 동향 (0) | 2021.03.02 |
Week 1) 데이터 큐레이션 실습 (0) | 2021.02.23 |