필요한 사전 지식
마스터와 트랜잭션
팩트 테이블과 디멘전 테이블을 보기 전에 관계형 모델에서 사용되는 트랜잭션과 마스터의 개념부터 살펴보자
- 트랜잭션 : 시간과 함께 생성되는 데이터를 기록한 것 → 한 번 기록하면 변화하지 않음
- 마스터 : 트랜잭션에서 참고되는 각종 정보 → 상황에 따라 다시 쓰임
이 테이블들이 데이터 웨어하우스로 넘어오면서 팩트테이블(트랜잭션)과 디멘전테이블(마스터)이 된다.
위 그림에서 판매이력만 트랜잭션에 해당하고 나머지 테이블은 마스터다. 상황에 따라 상품, 점포, 고객 정보는 달라질 수 있으나, 판매이력은 한 번 생성되면 바뀌지 않는다. 판매이력(트랜잭션)에 마스터 테이블들의 정보가 참조된다.
팩트(fact) 테이블과 디멘전(dimension) 테이블
팩트(fact) 테이블
데이터 웨어하우스의 세계에서는 트랜잭션처럼 사실이 기록된 것을 팩트 테이블이라 한다.
- 관계형 디비에서 판매이력과 같은 테이블들이 DW에서 팩트 테이블로 가공된다.
- 지표 등을 산출하기 위해 집계의 대상이 되는 측정값, 수치 등을 저장
- 비즈니스 측정값, 수치시간에 따라 증가하는 데이터
디멘전 테이블
데이터 웨어하우스의 세계에서는 팩트 테이블에서 참고되는 마스터 데이터 등을 디멘전 테이블이라 한다.
- 관계형 디비에서 마스터 테이블들이 디멘전 테이블로 가공된다.
- 디멘전들은 비즈니스 프로세스에서 발생하는 이벤트에 대한 배경 설명을 담고 있음
- '판매이력'이라는 팩트에 대하여 누가, 어디서, 어떤 상품을 구매했는지에 대한 정보
반응형
'데이터' 카테고리의 다른 글
하둡이란? 하둡 에코시스템 구성 요소 (0) | 2022.06.08 |
---|---|
데이터 마트 vs 데이터 웨어하우스 vs 데이터 레이크 (0) | 2022.05.03 |
[airflow] excution_date, macros를 이용해 DAG 실행 시점 지정하기 (0) | 2022.01.05 |