Power BI 数据建模组件详解
1. 列的类型与特性
1.1 计算列
在 Power BI 中,计算列并非数据源中原本就存在的列,而是通过 DAX 表达式创建的。Power BI 采用 xVelocity 引擎,这是微软专有的内存数据处理引擎,它运用 ColumnStore 索引技术,依据列内数据的基数对列数据进行高度压缩。当刷新表数据时,该引擎会压缩所有物理列的数据并加载到内存中。
不过,计算列是在表加载到模型后才进行计算的。当刷新表时,新数据会加载到模型中,此时计算列的值就不再有效,引擎必须重新计算所有计算列。而且,引擎会按顺序计算表中的计算列,所以计算列的优化和压缩效果不如物理列。
1.2 分组和分箱列
在 Power BI Desktop 中,可以在任何列的基础上创建分组列,但只能为数值数据类型的列创建分箱列。分组和分箱是手动对列值进行分组的两种方式,在需要对数据进行分组时非常有用。
由于分组和分箱功能目前在模型视图中不可用,所以要创建新的分组或分箱列,需要切换到报表视图或数据视图,然后右键单击所需列,从上下文菜单中选择“新建组”选项。
以下是创建分组列的具体步骤:
1. 点击“数据视图”选项卡。
2. 右键单击“ProductCategory”列。
3. 点击“新建组”。
4. 在“名称”中输入“Bike Category”。
5. 从“未分组的值”列表中点击“Bikes”。
6. 点击“分组”按钮。
7. 勾选“包含其他组”选项。
8. 点击“确定”。
对于数值列,可以使用分箱选
超级会员免费看
订阅专栏 解锁全文
4842

被折叠的 条评论
为什么被折叠?



