매일 업데이트
2023-10-03 05:00 12 min

[Explained] Power BI에서 데이터 모델링이 수행되는 방법

Power BI 데이터 모델링 완벽 가이드

Power BI를 처음 사용하시거나 더 깊이 이해하고 싶으신가요? Power BI 데이터 모델링은 데이터 분석 여정의 핵심입니다. 데이터 모델링을 시작으로, 데이터 마이닝을 거쳐 Power BI 보고서에서 실질적인 통찰력을 도출하는 과정을 살펴봅니다.

데이터 모델링은 모든 데이터 분석 프로젝트의 근간입니다. 사용자가 접하는 데이터 시각화와 대시보드의 밑바탕에는 데이터 모델이 존재합니다.

다른 데이터 분석 도구들과 마찬가지로, Power BI 역시 데이터 통합, 변환, 데이터셋 내 테이블 간 관계 설정, 계산 추가 등을 백엔드에서 데이터 모델링을 통해 수행합니다.

Power BI 데이터 모델 생성 방법에 대한 단계별 가이드를 포함하여, Power BI 데이터 모델링에 대해 알아야 할 모든 것을 소개합니다.

데이터 모델링이란 무엇인가?

데이터 모델링은 테이블, 행, 열과 같은 데이터셋의 기본 요소들을 연결하여 데이터 구조, 관계, 속성을 단순화한 형태로 표현하는 과정입니다.

데이터를 효과적으로 구성하고 이해하도록 도와주며, 효율적인 저장, 검색, 분석을 가능하게 합니다. 백엔드 데이터 모델은 데이터베이스, 소프트웨어, 시스템 설계에 필수적입니다.

데이터 모델링에는 엔티티 식별, 속성 정의, 엔티티 간 관계 설정 등을 통해 패턴을 발견하고 실행 가능한 통찰력을 도출하는 과정이 포함됩니다. 이는 데이터 분석, 데이터 정확성 확보, 의사 결정 지원에 매우 중요한 역할을 합니다.

Power BI 데이터 분석에서 데이터 모델링의 중요성

데이터 모델링은 Power BI와 같은 데이터 분석 도구에서 매우 중요한 역할을 합니다. 이 비즈니스 인텔리전스 도구는 잘 구성된 데이터 모델을 기반으로 의미 있는 시각화와 통찰력을 생성합니다.

데이터 모델링 원칙을 적용하면, 다양한 출처의 데이터를 효과적으로 연결, 변환, 시각화할 수 있습니다. Power BI 데이터 모델링은 이러한 분석 도구에 표시되는 데이터가 정확하고 관련성이 있도록 보장합니다.

결론적으로, 데이터 모델링은 정보에 입각한 의사 결정을 촉진하고 데이터 기반 통찰력의 잠재력을 최대한 활용하는 데 기여합니다. Power BI와 같은 강력한 분석 도구가 귀중한 비즈니스 인텔리전스를 제공하는 데 필요한 기반을 제공하는 역할을 합니다.

데이터 모델링의 유형

#1. 개념적 데이터 모델링

개념적 데이터 모델링은 데이터의 큰 그림에 초점을 맞춥니다. 특정 데이터베이스 구조나 기술적인 세부사항에 구애받지 않고 데이터를 높은 수준에서 표현합니다. 이러한 접근 방식은 데이터를 조직의 목표와 일치시키고, 이해관계자가 데이터의 목적과 중요성을 파악하는 데 도움을 줍니다.

#2. 물리적 데이터 모델링

물리적 데이터 모델링은 저장 및 검색의 기술적 구현 측면을 고려하여 데이터셋을 모델링합니다. 데이터베이스 시스템에서 사용되는 테이블, 인덱스, 제약 조건과 같은 데이터 저장 구조를 구체적으로 정의합니다.

#3. 논리적 데이터 모델링

논리적 데이터 모델링은 개념적 모델링과 물리적 모델링 사이의 간극을 메웁니다. 데이터베이스 설계의 청사진 역할을 하며, 데이터 무결성과 일관성을 유지하면서 비즈니스 이해관계자와 기술 팀 간의 원활한 의사소통을 돕습니다.

Power BI 데이터 모델링 기법

#1. 스타 스키마

스타 스키마는 Power BI에서 가장 널리 사용되는 데이터 모델링 기법 중 하나입니다. 이 접근 방식은 주요 지표와 측정값을 포함하는 중앙 팩트 테이블을, 데이터에 대한 컨텍스트를 제공하는 차원 테이블로 둘러싸는 구조를 가집니다. 팩트 테이블이 중심에 있고 차원 테이블이 별처럼 연결되어 있어 "별" 모양을 연상시킵니다.

#2. 카디널리티

카디널리티는 Power BI에서 테이블 간의 관계를 정의합니다. 한 테이블의 고유 값이 다른 테이블의 값과 일치하는 수를 나타냅니다. 카디널리티 옵션에는 일대일, 일대다, 다대일이 있습니다. 정확한 데이터 모델링을 위해서는 적절한 카디널리티 선택이 중요합니다.

#3. 교차 필터 방향

교차 필터 방향은 연결된 테이블 중 하나의 데이터에 적용된 필터가 다른 테이블의 데이터에 미치는 영향을 정의합니다. 교차 필터 방향에는 두 가지 유형이 있습니다.

단방향

단방향 교차 필터 방향은 필터가 일반적으로 차원 테이블에서 팩트 테이블로 한 방향으로만 흐르는 관계 옵션입니다. 즉, 차원 테이블을 필터링하면 팩트 테이블에 영향을 주지만 그 반대는 적용되지 않습니다.

양방향

양방향 교차 필터를 사용하면 필터가 팩트 테이블과 차원 테이블 사이에서 양방향으로 흐를 수 있습니다. 특정 상황에서는 유용할 수 있지만, 제대로 관리하지 않으면 예기치 않은 결과를 초래할 수 있으므로 주의해서 사용해야 합니다.

#4. 스노우플레이크 스키마

이미지 출처: Learn.Microsoft.Com

스노우플레이크 스키마는 차원 테이블이 하위 차원으로 정규화된 스타 스키마의 확장 형태입니다. 보다 구조화되고 복잡한 스키마를 생성합니다. 데이터 중복성을 줄일 수 있지만, Power BI에서 탐색하는 데 더 많은 노력이 필요할 수 있습니다.

#5. 조회 테이블

조회 테이블은 제품 세부 정보나 지리적 데이터와 같은 참조 정보를 담고 있는 차원 테이블입니다. 팩트 테이블의 데이터를 보강하고 분석을 위한 추가적인 컨텍스트를 제공하는 데 사용됩니다.

#6. 데이터 테이블

데이터 테이블은 때때로 팩트 테이블과 같은 의미로 사용되는 용어입니다. 측정값과 외래 키를 포함하는 기본 데이터를 담고 있으며, Power BI 보고서와 시각화의 기반 역할을 합니다.

Power BI 데이터 모델링의 이점

  • Power BI 데이터 모델링을 통해 여러 데이터 테이블을 연결하여 전체 데이터셋을 분석하거나 보고서 및 대시보드 제작 시 여러 테이블의 데이터를 활용할 수 있습니다.
  • 잘 구조화된 데이터 모델은 Power BI에서 강력하고 의미 있는 시각화를 가능하게 합니다.
  • 일반 사용자도 데이터 모델을 기반으로 데이터의 시각적 측면과 쉽게 상호 작용할 수 있습니다.
  • 최적화된 Power BI 데이터 모델은 수백만 개의 행으로 구성된 대규모 데이터베이스에서 데이터 쿼리 속도를 향상시킵니다.
  • 백엔드에 구조화된 데이터 모델을 사용하면 모든 테이블을 분석하여 대규모 데이터셋을 깊이 있게 탐색할 수 있습니다.
  • 하나의 데이터 모델을 다른 데이터 모델에 쉽게 연결하거나 여러 보고서의 데이터 모델을 참조하여 데이터셋을 상호 연결함으로써 고급 통찰력 추출이 가능합니다.
  • Power BI 데이터 모델을 만들고 역할 기반 접근을 통해 보안을 유지함으로써 데이터의 민감한 부분을 제어 및 보호하고 공개 가능한 부분을 개방적으로 유지할 수 있습니다.
  • 소매 POS, 앱, 마켓플레이스 등에서 수집된 실시간 데이터 세트와 같이 지속적으로 증가하는 데이터 세트를 처리할 때, 전체 데이터 세트를 분석하기 전에 데이터 모델을 구축해야 합니다.

Power BI에서 데이터 모델링하는 방법

Power BI에서 데이터 모델을 만드는 과정은 매우 간단합니다. 다음은 따라야 할 단계입니다.

데이터 세트를 Power BI로 가져오기

가장 먼저 해야 할 일은 데이터 세트를 Power BI로 가져오는 것입니다. 원하는 만큼의 데이터 세트나 테이블, 열, 행과 같은 많은 데이터 객체를 포함한 데이터 세트를 가져올 수 있습니다.

Power BI는 가져온 데이터 세트 또는 데이터 객체를 자동으로 분석하고 열 머리글 또는 테이블 머리글의 이름을 기반으로 기본 데이터 모델을 생성합니다.

데이터 세트를 가져오려면 다음 단계를 따르십시오:

  • Power BI 데스크톱 앱을 실행합니다.
  • 시작 화면과 함께 Power BI 작업 공간이 나타납니다.
  • 데이터 가져오기를 클릭합니다.
  • 데이터 가져오기 대화 상자의 왼쪽 탐색 창에서 가져올 데이터 범주를 선택하고 오른쪽 탐색 창에서 데이터 소스 또는 유형을 선택합니다.
  • 기본 데이터 소스 유형 선택은 '모두'입니다.
  • 예시에서는 Excel 통합 문서를 사용하므로 오른쪽에서 Excel 통합 문서 옵션을 선택하고 연결을 클릭합니다.

  • 열기 대화 상자에서 PC에 저장된 Excel 파일을 찾아서 두 번 클릭하면 Power BI로 가져옵니다.

  • 탐색기 대화 상자가 나타납니다.
  • 여기에서 Power BI 보고서로 가져올 데이터 객체를 선택하십시오.
  • 로드를 클릭하여 Power BI에서 데이터 가져오기 프로세스를 완료합니다.

Power BI 데이터 모델 생성

탐색기에서 '로드' 버튼을 클릭하면 Power BI가 데이터셋 분석, 데이터 객체 모델 생성, 데이터 모델 생성을 시작하고 마지막으로 보고서 보기 탭으로 이동합니다.

왼쪽 패널에서 테이블 보기 메뉴를 클릭하면 Power BI로 가져온 모든 데이터 객체의 테이블 형태를 확인할 수 있습니다.

Power BI는 지금까지의 작업을 자동으로 저장하지 않습니다. 따라서 리본 메뉴에서 파일을 클릭한 다음 왼쪽 패널에서 저장을 클릭하여 파일을 PC의 위치에 저장해야 합니다.

이제 Power BI의 데이터 모델링 과정을 자세히 살펴보겠습니다. 다음 단계를 따르세요:

  • Power BI 작업 공간의 왼쪽 패널에서 모델 보기 탭을 클릭합니다.
  • Power BI에서 생성한 기본 데이터 모델이 표시됩니다.
  • 예시에서는 중앙에 팩트 테이블이 있고 그 주변을 차원 테이블이 둘러싸고 있는 스타 스키마 구조를 확인할 수 있습니다.

  • Power BI가 데이터 모델 연결을 항상 정확하게 생성하지 못할 수도 있습니다.
  • 예시에서는 'Geography'와 'Geo'라는 유사한 열 머리글이 있지만 팩트 테이블을 'Table24' 차원과 연결할 수 없습니다.
  • 열 머리글이 정확히 일치하지 않기 때문입니다.
  • 이 문제를 해결하려면 'Table24'를 팩트 테이블 'Main Data'에 연결하고, 'Table24'의 'Geo' 객체를 팩트 테이블의 'Geography' 요소 중심으로 드래그하면 됩니다.

Power BI에서 데이터 모델 생성이 완료되었습니다. 관계선에 나타나는 다양한 객체의 의미는 다음과 같습니다.

  • 팩트 테이블 가장자리의 별표(*)와 차원 테이블 가장자리의 숫자 1은 일대다 연결을 나타냅니다.
  • Power BI의 두 테이블을 연결하는 선의 화살표는 필터 방향을 나타냅니다. 화살표의 뾰족한 끝이 팩트 테이블을 가리키면 차원 테이블에 적용된 모든 필터가 팩트 테이블에 영향을 미칩니다.

  • 화살표가 양쪽 방향으로 있는 경우 필터는 팩트 테이블과 차원 테이블 모두에 영향을 줍니다.

데이터 시각화

이제 데이터 세트를 시각화하여 실행 가능한 통찰력을 추출하는 방법은 다음과 같습니다.

  • 보고서 보기 탭을 클릭합니다.
  • 오른쪽의 시각화 섹션에서 차트를 선택하십시오.

  • 누적 세로 막대형 차트를 선택했습니다.
  • Power BI 작업 공간의 오른쪽에 있는 데이터 세트를 확장합니다.

  • 차트 편집기의 X축 및 Y축 필드로 항목을 끌어다 놓습니다.
  • Power BI가 자동으로 차트를 생성합니다.

Power BI 데이터 모델링 활용 사례

전체적인 보고서 생성

다차원 보고서 또는 대시보드를 만들려면 Power BI의 데이터 모델링 기능을 활용해야 합니다. 하나의 테이블 데이터만으로는 충분한 정보를 얻을 수 없을 수 있지만, 다양한 데이터 세트와 객체에서 데이터를 가져오면 더욱 의미있는 방식으로 데이터를 시각화할 수 있습니다.

데이터 통합

원본 Excel 통합 문서나 SQL 데이터베이스에 많은 데이터 세트 또는 테이블이 있다고 가정해 보겠습니다. 다양한 Power BI 보고서를 각각 생성하는 대신, 별 모양 또는 눈송이 스키마를 사용하여 모든 보고서를 연결하고 통합적으로 시각화할 수 있습니다. 모든 데이터 객체를 통합하면 더욱 효과적인 데이터 스토리텔링이 가능합니다.

데이터 정제 및 변환

Power BI 데이터 모델을 만들 때 원시 데이터 세트를 정리하고 변환해야 할 필요성이 명확해집니다.

예를 들어, 도구가 데이터 모델에서 관련 데이터 열이나 테이블을 연결할 수 없는 경우, 열 머리글에 불일치가 존재할 수 있습니다. 이 경우 수정해야 할 부분을 정확히 파악할 수 있습니다.

또 다른 예로, 테이블에 불필요한 요소가 있을 수 있습니다. 데이터 세트에 US, CA, UK, DE의 네 지역만 있어야 하지만, 데이터 모델에 빈 추가 항목이 나타날 수 있습니다. 이는 일부 지리 이름에 불필요한 공백이 포함되어 Power BI가 이를 새로운 지리 요소로 분류하기 때문입니다.

데이터 가시성 제어

모델 보기 탭을 사용하여 Power BI 보고서 또는 대시보드 내용을 볼 수 있는 사용자를 제한할 수 있습니다. Power BI 데이터 모델 작업 공간에서 각 데이터 카드에 있는 눈 모양 아이콘을 클릭하면 테이블을 숨기거나 숨김 해제할 수 있습니다.

데이터 카드에 두 개 이상의 열이 있는 경우 해당 열의 표시 여부도 사용자 정의할 수 있습니다.

선택한 데이터 테이블 조작

Power BI 데이터 모델 인터페이스의 각 데이터 테이블에는 추가 옵션을 위한 세 개의 점 아이콘이 함께 제공됩니다. 여기서 선택한 데이터 테이블에서 수행할 수 있는 다양한 활동을 확인할 수 있습니다.

  • 새 측정값 또는 열 생성
  • 데이터 새로 고침
  • 관계 관리
  • 증분 새로 고침
  • 집계 관리
  • 그 외 다양한 기능

결론

이것이 바로 Power BI에서 논리적인 보고서나 대시보드 하나에서 대규모 분산 데이터 세트를 시각화하는 데 필요한 데이터 모델입니다.

지금까지 Power BI의 다양한 데이터 모델링 기법을 살펴보고, 처음부터 Power BI 데이터 모델을 만드는 단계를 알아보았습니다. 제시된 단계를 따라 자신만의 데이터 모델을 즉시 만들어 보세요.

다음으로, 데이터 과학 또는 데이터 분석가 경력을 시작하는 데 도움이 될 최고의 데이터 분석가 과정들을 살펴보겠습니다.

저자
Korea

기술 트렌드와 실용적인 팁을 전하는 लेखक입니다.