数据清洗、转换与加载全解析
1. Power Query 基础与 M 语言
Power Query 在 Power BI 中并非新事物,它也是 Excel 的重要组成部分。除了 Power BI 和 Excel,还有其他产品也将 Power Query 作为一种以低代码方式实现查询开发现代化的手段。
Power Query 采用的是 M 语言,而非 SQL。M 即 mash - up 的缩写,是一种函数式、区分大小写的查询公式语言。作为 Power BI 查询编辑器的一部分,M 语言用于在数据加载到 Power BI 模型之前进行准备工作。M 语言专门用于查询,而 DAX(数据分析表达式语言)则是数据科学和分析专业人员用于深入分析的分析性数据计算语言。M 语言主要用于数据转换阶段,而 DAX 用于数据视图阶段。
2. 解决数据不一致问题
数据量越大,就越需要留意数据中的不一致性、意外值、空值和其他数据质量问题。Power BI 在 Power Query 的帮助下,为用户提供了多种处理不一致性的方法,包括替换值、删除行和进行根本原因分析。
2.1 替换值
用户可以在 Power Query 编辑器界面中直接将错误值替换为所需结果。当在创建或导入到 Power BI 的数据源中出现错误时,就可以使用这种方法。例如,将空值替换为更新后的唯一值。不过,使用此技术时要注意:用户必须修复数据源中的错误,否则刷新时这些值可能会被覆盖。操作步骤如下:
- 替换错误值 :
1. 在 Power Query 编辑器中,右键单击列标题,从出现的菜单中选择“替换错误”。
超级会员免费看
订阅专栏 解锁全文
925

被折叠的 条评论
为什么被折叠?



