본문 바로가기

데이터

팩트(fact) 테이블 vs 디멘전(dimension) 테이블

필요한 사전 지식

 

데이터 마트 vs 데이터 웨어하우스 vs 데이터 레이크

빅데이터를 다를 때 데이터 마트, 데이터 웨어하우스, 데이터 레이크와 같은 용어를 많이 듣게 된다. 각각이 무엇이고 어떻게 다른지 알아보자 데이터 웨어하우스 데이터 웨어하우스(DW)는 축적

juhi.tistory.com

마스터와 트랜잭션

팩트 테이블과 디멘전 테이블을 보기 전에 관계형 모델에서 사용되는 트랜잭션과 마스터의 개념부터 살펴보자 

  • 트랜잭션 : 시간과 함께 생성되는 데이터를 기록한 것 → 한 번 기록하면 변화하지 않음
  • 마스터 : 트랜잭션에서 참고되는 각종 정보 → 상황에 따라 다시 쓰임
이 테이블들이 데이터 웨어하우스로 넘어오면서 팩트테이블(트랜잭션)과 디멘전테이블(마스터)이 된다.

위 그림에서 판매이력만 트랜잭션에 해당하고 나머지 테이블은 마스터다. 상황에 따라 상품, 점포, 고객 정보는 달라질 수 있으나, 판매이력은 한 번 생성되면 바뀌지 않는다. 판매이력(트랜잭션)에 마스터 테이블들의 정보가 참조된다. 

팩트(fact) 테이블과 디멘전(dimension) 테이블

팩트(fact) 테이블

데이터 웨어하우스의 세계에서는 트랜잭션처럼 사실이 기록된 것을 팩트 테이블이라 한다.

  • 관계형 디비에서 판매이력과 같은 테이블들이 DW에서 팩트 테이블로 가공된다.
  • 지표 등을 산출하기 위해 집계의 대상이 되는 측정값, 수치 등을 저장
  • 비즈니스 측정값, 수치시간에 따라 증가하는 데이터

디멘전 테이블 

데이터 웨어하우스의 세계에서는 팩트 테이블에서 참고되는 마스터 데이터 등을 디멘전 테이블이라 한다.

  • 관계형 디비에서 마스터 테이블들이 디멘전 테이블로 가공된다.
  • 디멘전들은 비즈니스 프로세스에서 발생하는 이벤트에 대한 배경 설명을 담고 있음
  • '판매이력'이라는 팩트에 대하여 누가, 어디서, 어떤 상품을 구매했는지에 대한 정보
반응형