Week 1 : Course Introduction
Lecture 1-1
더보기
1. Evaluation
No 시험~~!! 매주 실습을 잘해서 냅시당!
영어 수업이지만 영어가 어렵다면 한국말로 작성해도 괜찮습니다.
2. Procedure of online class
Lecture 1-2
1. 디지털 데이터 큐레이션의 초기 정의 Initial Definition
- 데이터란 무엇인가?
- raw material
- 정보를 만들어 내는 것
- 의도적으로 아주 광범위하게 사용되는 초기 정의 : any information in binary digital form
- 디지털 큐레이션이란?
- the management and preservation of digital materials to ensure accessibility over the long-term. (Abbott 2008)
- 단순히 디저털 물질 (데이터)를 preserve + 관리하여 오랜 시간에 걸쳐 접근하기 쉽게 하는 것
- 미래에도 데이터를 사용해야 하기 때문에 데이터 보호, 위험 관리 등에 대한 이슈도 다룸
- Simple digital object vs Complex digital object
- simple : ex) 텍스트, 이미지, 사운드 파일 등
- complex : 서로 다른 디지털 파일을 조합하여 만든 디지털 오브젝트 ex) 웹 사이트
2. 데이터 큐레이션의 필요성
- 현 세대는 모든 곳에서 방대한 양의 데이터가 생성되고, 그 증가량이 엄청나다. => generaton of massive quantities
- self-quantifier : 데이터를 모으고 평가, 정량화 하는 것
- technology obsolescence : 기술이 완전하지 않기 때문에 데이터도 완전하지 않다. 컴퓨터나 소프트웨어가 빈번하게 업데이트 되기 때문에 종종 데이터에 접근할 수 없는 경험이 있을 것이다. (기술의 노후화)
- technology fragility : 기술은 아주 연약하다. 작은 변화에도 데이터에 접근할 수 없게 될 수 있다.
- inadquate resource : 모든 데이터를 수집하고 관리하기엔 자원이 부족하다.
- 저장 공간이 늘어나고, 데이터 큐레이션을 지원하는 기술, 실습 등의 발전
- 컴퓨터 네트워크에 대한 의존성의 증가
- 디지털 환경에 대한 연구가 진행되고 있음
- 과학 컨텍스트의 변화 : 연구실 기반 → 컴퓨터, 온라인 기반 (e-Science)
3. e-Science 의 관점
- 인터넷, 컴퓨터, 소프트웨어 기반의 과학은 방대한 양의 데이터를 만들어 낸다.
- 또한 미래에도 데이터에 접근하고 사용할 수 있도록 요구한다.
- 큰 데이터가 학문 분석의 기반이 되기 때문에 데이터에 접근할 수 있어야 한다.
- 즉, 많은 양의 데이터가 생산되는 만큼 많은 데이터에 접근할 수 있어야 좋은 연구를 할 수 있고, 학문을 발전시키는데 도움을 줄 수 있다.
Lecture 1-3
1. Nonacademic Environments
- 정부, 기업 등의 오픈 정책, 투명성, 효율성, 설명 가능, 반응 등에 대한 정책을 위해 데이터 큐레이션이 필요함을 다시 한번 강조.
- Brophy and Frey (2006)의주장
- 주석과 발행된 데이터들과 관련된 디지털 정보 간 연결을 유지해야 한다.
- 디지털 정보의 장기적 접근 가능성, 재사용성, 완전성, 진실성, 증명성등을 보장해야 한다.
- 디지털 정보를 보존하기 위해 migration, emnulation 등을 수행해야 한다.
- 디지털 정보의 위험을 관리해야 한다.
- 디지털 정보의 destruction을 보장해야 한다.
2. What is Digital Curation (review)
- 디지털 아카이빙, 보존을 넘어선 개념
- 디지털 오브젝트의 전 생애 주기에 적용되는 전체 프로세스
- 디지털 오브젝트가 만들어지기 전에 디지털 큐레이션이 시작되어야 한다.
- 디지털 큐레이션은 데이터와 디지털 오브젝트에 가치를 부여하는 것을 강조된다.
- 디지털화 된 정보에 접근할 수 있게 하는 것
Digital curation is concerned with actively managin data for as long as it continues to be of scholarly, scientific, research, administrative, and/or personal interest, with the aims of supporting reproducibility, reuse of, and adding value to that data, managing it from its point of creation until it is determined not to be useful, and ensuring its accessibility, preservation, authenticity, and integrity over time.
3. 디지털 연속성에 대한 위협
- 자연 재해
- 비밀번호, 암호화 등으로 보호
- 잃어버리기 전에 그것에 대한 가치를 인지하지 못할 수도 있음
- 가치를 알아보았더라도 별 다른 조치를 취하지 않는 경우도 빈번
- 적절하지 않은 기관이나 사람이 조치를 취할 수도 있음
- 보존에 필요한 법적 허가가 나지 않을 수도 있음
4. 디지털 큐레이션의 인센티브와 장점
- 디지털 큐레이션하는 기관이나 기업에 투자
- 데이터를 관리하고 보존하면서도 해당 데이터에 대한 이해도가 떨어지지 않도록 유지
- improving access : 해당 데이터에 접근성이 좋아짐
- improving data quality : 보존한 데이터를 관리하며 양질의 데이터를 유지
- encouraging data sharing and reuse
- protecting data
- 데이터 생산자에게도 이득
- 데이터의 질, 접근성을 향상시키려고 노력할
- 해당 데이터의 연구에 대한 기여와 인용 비율이 높아짐
- 공공의 이익
- open access 움직임으로 강조되는 public good
- public good 의무
- 등등.. 여러 가지 이유들이 조합됨 (법적 + 사회적 + ... )
5. 디지털 큐레이터
- 큰 큐모의 데이터 셋을 과학적, 문헌적, 아카이브 컨텍스트에서 관리하고 큐레이션하는 사람
- 디지털 오브젝트가 생성되었을 때 가장 사용가능하도록 만드는 것
References
- 2021-1 성균관대학교 문헌정보학과 <데이터 큐레이션 실습>, 김영식 교수님 수업을 들으며 정리한 내용입니다.
'컴퓨터 공학 > 데이터 큐레이션' 카테고리의 다른 글
Week6) 데이터 큐레이션 실습 : description & representation information (0) | 2021.03.29 |
---|---|
Week5) 데이터 큐레이션 실습 : 큐레이션의 특징 (0) | 2021.03.22 |
Week4) 데이터 큐레이션 실습 : 데이터 정의 (0) | 2021.03.16 |
Week3) 데이터 큐레이션 실습 : 데이터 큐레이션의 개념적 모델 (0) | 2021.03.09 |
Week2 ) 데이터 큐레이션 실습 : 데이터 큐레이션의 동향 (0) | 2021.03.02 |