[4일차]공공데이터 개방/품질 기초
[1. 데이터 품질 관리의 이해 1]
공공데이터 품질 관리란?
- 공공데이터의 최신성, 정확성, 상호연계성 등을 확보하여, 사용자에게 유용한 가치를 제공하도록 안정적이고 지속적인 품질 수준 유지를 위한 일련의 활동
[계획단계 품질관리]
- 각 기관은공공데이터 품질관리 위한 내부규정 마련 및 추진조직을 구성하고, 소관 공공데이터의 품질관리계획을 수립하여 매년 시행
[구축단계 품질관리]
DB 구축 시, 데이터 표준을 적용하고, 데이터구조 일관성 확보, 오류 데이터 유입방지, 데이터 관련 산출물을 확보해야 함
데이터 표준 수립 : 각 기관은 소관 데이터에 일관되게 적용할 표준코드, 표준용어, 표준도메인을 정의
[운영단계 품질관리]
연계데이터 정합성 관리 : 연계 데이터에 대한 현황을 체계적으로 관리하고, 상호 연계에 대한 표준과 절차를 명확히 하여 연계 전 품질 검증 및 연계 후 품질에 대한 수준을 검증하는 과정이 필요
데이터 산출물 관리
[활용단계 품질관리]
[데이터 품질관리의 이해 2]
데이터 품질진단 및 개선 절차
1. 진단대상 정의
2. 품질진단 실시
3. 진단결과 분석
4. 개선계획 수립
5. 개선 실시
6. 품질 통제
[공공데이터 품질관리 수준평가 제도 소개]
[공공데이터 품질관리 수준평가 지표 설명 1]
[공공데이터 포털 소개]
공공데이터 제공방식
공공데이터 형식
5 Star Open Data (by Tim Berners-Lee)
★. 오픈포멧 1단계
- 데이터를 웹 상에 오픈 라이선스(무료 이용 등)으로 공개
- 포맷에 대한 상관이 없으며, 국내에서는 일반적으로 편집(write, delete, update)이 불가능한 데이터 파일 포맷을 지칭
- PDF 파일 등
★★. 오픈포멧 2단계
- 특정 SW에 대하여 종속적인 데이터 파일 포맷
- 사용자 입장에서는 제공이 편함
- 이용자가 수정은 가능하나 특정 SW를 보유하고 있어야 함 (공공기관 사용 지양)
- XLSX(엑셀), HWP 등
★★★. 오픈포맷 3단계
- 특정 SW에 대한 종속성이 제거된 파일 포맷으로, 공공데이터 관리지침에 따라 권고하는 공공데이터 개방 파일 형식
- 특정 SW가 없어도 열 수 있는 파일 형식이라 공공기관에서 많이 사용 됨
- CSV (comma seperated values, 쉼표로 구분된 값), TXT 등
★★★★. 오픈포맷 4단계
- 각 개체(Entity, 예: 특정일 기온 예보) 혹은 데이터 항목은 URI (Uniform Resource ID)를 보유
- URI는 웹 상의 특정 콘텐츠를 텍스트, 이미지, 동영상 등 다른 콘텐츠들과 구별하여 인식 및 확인 할 수 있는 고유 식별자
- 데이터 안의 객체 즉, 데이터 안의 데이터에 대해 URI를 부여하면 데이터의 재 사용, 외부 연계, 데이터 결합 등이 쉽게 가능해 짐
- 오픈 포맷 3단계처럼 SW에 대한 종속성 없음
- 이용자가 XML 등 마크업 언어에 익숙해야 함
- 각 데이터마다 URI를 부여해야 하므로 아직 많은 공공기관에서 상용화되지는 않음
★★★★★. 오픈포맷 5단계
- 각 데이터 항목에 문맥과 배경 정보를 제공하기 위해 다른 데이터와 연결(Link)
- 이와 같은 데이터 구조를 Link Open Data라고 함 (LOD)
- 시맨틱 웹인 world wide web에서 활용성이 높은 구조 (아직 국내에서 4단계가 정착하지 않았으므로 5단계로 데이터 제공하는 공공기관은 거의 없음)
- '기온' 항목의 추가 정보(정의)를 제공하기 위해 위키피디아의 데이터 '기온'과 연결
[기계 판독 가능 형태의 데이터 포멧]
[공공데이터포털 세부 기능]
공공데이터포털의 9가지 기능
[오픈 API]
Application Program Interface의 약어로 서비스 개발자 등 사용자가 응용프로그램을 쉽고 용이하게 개발할 수 있도록 표준화된 개방형 인터페이스
*공공데이터포털에서는 분석서비스도 제공함
- 상관분석, 회귀분석, 텍스트 마이닝
* 국민참여지도 - 토픽을 지정하여 지도에 표시하고 공유할 수 있음
* 위치정보 시각화 기능도 있음 POI (Point of Interest)