기술사 노트/7. 데이터베이스

데이터 리니지 (Data Lineage)

skyand34 2025. 5. 31. 21:55

I.  데이터 계보관리, 데이터 리니지의 정의

- 데이터 이력관리 위해 데이터 생성, 변경, 이동흐름을 관리하는 메타데이터 기반 데이터 계보

 

II. 데이터 리니지의 매커니즘과 구성요소

가. 데이터 리니지의 매커니즘

https://www.itdaily.kr/news/articleView.html?idxno=83523

나. 데이터 리니지의 구성요소

구분 기술요소 특징
수집, 분석 EDF - AP, ETT, DA 모델 (Enterprise Data Framework)
외부솔루션 - BI/DW, EAI, ETL, CDC, Log
적재, 관리 맵핑정보 - Data Flow, Data Management
메타데이터 - 데이터 모델, 맵핑/시스템 구성 정보
시각화

시각화 도구 - 데이터 맵, 테이블/컬럼 프로세스
리포팅 - 연관 리포팅, BI 리포팅

 

III. 데이터 리니지와 데이터 프로비넌스 (Provenance) 비교

비교 데이터 리니지 데이터 프로비넌스
개념 데이터의 흐름, 변환 추적 데이터의 출처 관리
목적 추적성, 가시성 제공 출처, 신뢰성 검증
주요 요소 데이터 소스, 처리단계, 목적지 생성 날짜, 변경기록, 책임자
활용 사례 ETL 모니터링, 데이터 흐름 분석 데이터 감사, 공유, 협업

 

- AI와 ML이 접목되면서 자동화되고, 능동적인 데이터 분석과 이상탐지, 예측 기능이 강화될 것으로 전망.

 


참고자료