加入 PowerBI自己学 知识星球:下载源文件,边学边练;遇到问题,还可以提问交流。
PowerQuery是PowerBI的组件,也是Excel的组件,还是一个独立的模块,为很多微软的其他下游工具做数据准备。它是用来获取和清洗数据的自动化工具,做的是ETL(Extract-获取、Transform-转换、Load-加载)的工作。
PowerQuery使用的是M语言,倡导用鼠标“点点点”的图形化操作,生成一系列分步骤可编辑的查询计划,多个查询计划在后台自动按照依赖关系排列刷新的先手顺序。业务人员可以不深入研究M语言,通过鼠标“点点点”操作,查看高级编辑器中的代码,学会读代码和简单修改代码,使用一些常用函数,就可以满足大部分数据获取和清洗需求。
在PowerBI中,PowerQuery只是起点,它要为下一步数据建模做准备,生成一系列干净的(尽可能是一维的)维度表、事实表、辅助表、参数等。常用的功能包括:获取数据、表处理(提升标题、筛选、删除列、逆透视、分组、数据类型等)、列处理(填充、替换、去重、列命名、列排序等)、拆分列、添加列、数据合并(追加查询、合并查询)等。这些功能的使用顺序通常是先通过筛选、删除列减少要处理的数据量,然后再使用尽可能少的步骤去完成后续的清洗工作,比如多个表先追加查询为一个表再做其他处理。