2020 공공 데이터 인턴

[4일차]공공데이터 개방/품질 기초

빵으니 2020. 8. 21. 14:05

[1. 데이터 품질 관리의 이해 1]

공공데이터 품질 관리란?

- 공공데이터의 최신성, 정확성, 상호연계성 등을 확보하여, 사용자에게 유용한 가치를 제공하도록 안정적이고 지속적인 품질 수준 유지를 위한 일련의 활동

 

[계획단계 품질관리]

- 각 기관은공공데이터 품질관리 위한 내부규정 마련 및 추진조직을 구성하고, 소관 공공데이터의 품질관리계획을 수립하여 매년 시행

 

[구축단계 품질관리]

DB 구축 시, 데이터 표준을 적용하고, 데이터구조 일관성 확보, 오류 데이터 유입방지, 데이터 관련 산출물을 확보해야 함

 

데이터 표준 수립 : 각 기관은 소관 데이터에 일관되게 적용할 표준코드, 표준용어, 표준도메인을 정의

 

[운영단계 품질관리]

연계데이터 정합성 관리 : 연계 데이터에 대한 현황을 체계적으로 관리하고, 상호 연계에 대한 표준과 절차를 명확히 하여 연계 전 품질 검증 및 연계 후 품질에 대한 수준을 검증하는 과정이 필요

 

데이터 산출물 관리

 

[활용단계 품질관리]


[데이터 품질관리의 이해 2]

 

데이터 품질진단 및 개선 절차

 

1. 진단대상 정의

 

2. 품질진단 실시

 

3. 진단결과 분석

 

4. 개선계획 수립

 

5. 개선 실시

 

6. 품질 통제


[공공데이터 품질관리 수준평가 제도 소개]

 

[공공데이터 품질관리 수준평가 지표 설명 1]

 

[공공데이터 포털 소개]

공공데이터 제공방식

오픈 API는 보통 개발자용 / 다운로드 자료는 일반인용

 

공공데이터 형식 

5 Star Open Data (by Tim Berners-Lee)

 

. 오픈포멧 1단계

- 데이터를 웹 상에 오픈 라이선스(무료 이용 등)으로 공개

- 포맷에 대한 상관이 없으며, 국내에서는 일반적으로 편집(write, delete, update)이 불가능한 데이터 파일 포맷을 지칭

- PDF 파일 등

 

. 오픈포멧 2단계

- 특정 SW에 대하여 종속적인 데이터 파일 포맷

- 사용자 입장에서는 제공이 편함

- 이용자가 수정은 가능하나 특정 SW를 보유하고 있어야 함 (공공기관 사용 지양)

- XLSX(엑셀), HWP 등 

 

★. 오픈포맷 3단계 

- 특정 SW에 대한 종속성이 제거된 파일 포맷으로, 공공데이터 관리지침에 따라 권고하는 공공데이터 개방 파일 형식

- 특정 SW가 없어도 열 수 있는 파일 형식이라 공공기관에서 많이 사용 됨

- CSV (comma seperated values, 쉼표로 구분된 값), TXT 등

★. 오픈포맷 4단계

- 각 개체(Entity, 예: 특정일 기온 예보) 혹은 데이터 항목은 URI (Uniform Resource ID)를 보유

- URI는 웹 상의 특정 콘텐츠를 텍스트, 이미지, 동영상 등 다른 콘텐츠들과 구별하여 인식 및 확인 할 수 있는 고유 식별자

- 데이터 안의 객체 즉, 데이터 안의 데이터에 대해 URI를 부여하면 데이터의 재 사용, 외부 연계, 데이터 결합 등이 쉽게 가능해 짐

- 오픈 포맷 3단계처럼 SW에 대한 종속성 없음

- 이용자가 XML 등 마크업 언어에 익숙해야 함

- 각 데이터마다 URI를 부여해야 하므로 아직 많은 공공기관에서 상용화되지는 않음

★. 오픈포맷 5단계

- 각 데이터 항목에 문맥과 배경 정보를 제공하기 위해 다른 데이터와 연결(Link)

- 이와 같은 데이터 구조를 Link Open Data라고 함 (LOD)

- 시맨틱 웹인 world wide web에서 활용성이 높은 구조 (아직 국내에서 4단계가 정착하지 않았으므로 5단계로 데이터 제공하는 공공기관은 거의 없음)

- '기온' 항목의 추가 정보(정의)를 제공하기 위해 위키피디아의 데이터 '기온'과 연결

 

[기계 판독 가능 형태의 데이터 포멧]


[공공데이터포털 세부 기능]

 

공공데이터포털의 9가지 기능

 

[오픈 API]

Application Program Interface의 약어로 서비스 개발자 등 사용자가 응용프로그램을 쉽고 용이하게 개발할 수 있도록 표준화된 개방형 인터페이스

 

*공공데이터포털에서는 분석서비스도 제공함

- 상관분석, 회귀분석, 텍스트 마이닝

* 국민참여지도 - 토픽을 지정하여 지도에 표시하고 공유할 수 있음

* 위치정보 시각화 기능도 있음 POI (Point of Interest)