商业智能:Power BI 全面指南
1. Power BI 基础要点
1.1 数据导入与模型简化
在使用 Power BI 时,数据导入和模型构建是关键的初始步骤。数据模型应聚焦于所考虑的业务挑战,仅导入必要的数据。与数据库中的实体关系模型不同,Power BI 更注重“简单性”,而非数据库中常见的“规范化”。例如,在一个汽车销售系统中,数据库可能有二十个表来描述,而在 Power BI 中,可能只需三个表。
为实现这种简单性,可采取以下步骤:
- 仅使用重要的表;
- 移除所有不必要的列(或使用简洁的 SQL 视图);
- 使用简单的表名和列名;
- 若可能,在导入数据前进行数据操作。
建议使用规范化的数据方案,类似于星型架构。星型架构由事实表和相应的维度表组成,如销售表是事实表,包含销售产品标识符、销售日期、订单数量、销售价格和销售人员等列,而产品表和人员表则是对应的维度表。
1.2 表间关系
导入表后,了解它们之间的关系至关重要。以汽车销售为例,销售表依赖于车辆表和客户表。在分析销售和车辆的关系时,需明确车辆记录的含义。例如,一条车辆记录 [10, Volkswagen, Golf, petrol, £ 16,500] 代表一个具有固定价格的可用车辆类别,而非某一辆具体的汽车。这意味着车辆表中的一条记录可能对应销售表中的多条记录,这种关系称为一对多(1: )。若方向改变,则为多对一( :1)。应尽量避免多对多(.)关系,因为它具有歧义,可通过引入中间表来避免。一对一(1:1)关系表示一个表中的每条记录在关联表中都有一条对应的记录。
超级会员免费看
订阅专栏 解锁全文
11

被折叠的 条评论
为什么被折叠?



