数据准备的常见最佳实践
1. 数据类型转换的影响
数据类型转换会影响数据模型的压缩率和性能。Power Query 类型与 DAX 数据类型之间存在映射关系。同时,若列的数据类型为“any”且未转换为更合适的数据类型,会带来一些问题。
1.1 避免使用“any”数据类型
Power Query 中所有数据类型都与“any”数据类型兼容,但数据模型层的 xVelocity 引擎不支持“any”数据类型。当数据加载到数据模型时,“any”数据类型会转换为文本,这可能不正确。例如,若列包含整数值,但数据类型为“any”,加载到数据模型时会变成文本,而文本比数字消耗更多内存。此外,刷新包含布尔值且类型为“any”的列可能导致意外行为。在 Power BI Desktop 中包含“ANY”数据类型列且该列包含 TRUE 或 FALSE 值时,刷新后 Power BI Desktop 和 Power BI Service 中该列的值可能不同。
1.2 尽可能在步骤中包含数据类型转换
一些常用的 Power Query 函数有可选操作数来强制函数输出的类型。若错过这一点,需要为数据类型转换添加至少一个额外步骤,转换步骤越多,数据刷新越慢。以下函数有可选的 columnType 操作数:
- Table.AddColumn(table as table, newColumnName as text, columnGenerator as function, optional columnType as nullable type)
- Table.DuplicateColumn(tab
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



