[데이터 품질의 이해 1]
인공지능 (AI)
- 딥러닝 기술이 핵심 기술이며, 빅데이터 분석과 클라우드 컴퓨팅 기술이 주요 동인 기술

[데이터 품질의 이해2]

[데이터 품질의 이해3]
[데이터 오류의 유형1]
데이터오류
- 시스템의 데이터베이스 구조가 잘못 설계되거나 입력하는 사람의 실수로 의도와 맞지 않는 데이터가 입력되었을 때 생기는 현상
[데이터 품질점검 기준 및 품질진단 절차 1]
데이터 품질 진단
- 도메인진단 : 컬럼의 고유한 특성을 진단
- 업무규칙 진단 : 업무요건 및 법령 진단
- 참조 무결성 진단 : 자식/부모 테이블 간 관계의 정합성을 진단


[데이터 품질진단 절차 상세]

[대상 칼럼 정보 수집]

[데이터 프로파일링]




[데이터 품질점검 기준 및 품질진단 절차 2]
[진단대상 분석]

[도메인분석]


[업무요건 분석]


[업무규칙 도출 대상 선정]

[업무규칙 상세화]

[진단대상 및 방법 선정]

[진단실행]

[네트워크 구성 예시]


[데이터 품질과 데이터 구조 1]
데이터 구조가 제대로 정리되어있지 않으면 데이터 품질도 높일 수 없다
데이터 모델과 모델링


[데이터 모델링 기법]


[엔티티 타입]

[속성]

[엔티티와 엔티티타입]

[관계]

[페어링과 관계]

[데이터 품질과 데이터 구조 2]
카디낼리티와 선택성(옵셔널리티)을 결정하는 것은 엔티티의 페어링






[식별자]

식별자의 구성요소
- 하나 혹은 다수의 속성으로 구성
- 하나 혹은 다수의 관계로 구성
- 속성과 관계의 조합으로 구성
[외부키(FK)]

[관계형 식별자]


[데이터 모델의 활용]




[데이터 아키텍처의 필요성]



'2020 공공 데이터 인턴' 카테고리의 다른 글
[5일차] 공공데이터 개방 수행방법론 (0) | 2020.08.24 |
---|---|
[4일차]공공데이터 개방/품질 기초 (0) | 2020.08.21 |
[3일차] 데이터 기초2 (0) | 2020.08.20 |
[2일차] 데이터 기초 1 (0) | 2020.08.19 |
[1일차] 오리엔테이션 및 공공데이터 정책 (0) | 2020.08.18 |
댓글