用Power Query进行数据清洗(一)

博客介绍了将图一数据转换为图二的方法,即选中表中数据,点击来自表格区域,将其导入Power Query编辑器进行处理。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

在这里插入图片描述
在这里插入图片描述
如何将图一变成图二
选中表中的数据,点击来自表格区域,导入Power query编辑器,

### 使用 Power Query 进行数据清洗 #### 什么是 Power QueryPower Query种强大的工具,用于从各种来源获取、转换和加载数据。它支持多种数据源,包括 Excel 文件、CSV 文件、数据库以及 Web API 等。 --- #### 数据清洗的关键操作 以下是通过 Power Query 实现数据清洗些常见方法: #### 1. 提取网页中的 Top250 条图书信息 可以按照如下方式实现批量提取并处理数据: - 利用 Power Query 的自定义函数功能来扩展数据范围。 - 设置链接的数据类型为“Web URL”,以便能够点击访问更多详情页面[^1]。 ```m let Source = Json.Document(Web.Contents("https://example.com/api")), DataList = Source[data], #"Converted to Table" = Table.FromList(DataList, Splitter.SplitByNothing(), null, null, ExtraValues.Error), #"Expanded Column" = Table.ExpandRecordColumn(#"Converted to Table", "Column1", {"title", "author"}, {"Title", "Author"}) in #"Expanded Column" ``` 上述代码展示了如何从 JSON 格式的 Web API 中读取数据,并将其转化为表格形式。 --- #### 2. 自定义函数调用 如果需要对多个表应用相同的逻辑,则可以通过创建自定义函数简化流程。例如,在 M 查询语言中编写以下语句可将嵌套列的内容提升到顶层字段名位置[^2]: ```m = (inputTable as table) => let PromotedHeaders = Table.TransformColumns(inputTable,{"Data", each Table.PromoteHeaders(_)} ) in PromotedHeaders ``` 此脚本接受输入参数 `inputTable` 并返回经过变换后的结果集。 --- #### 3. 更改数据类型与调整结构 当导入外部文件时可能会遇到某些列未被正确识别的情况;此时可通过显式指定其类别解决该问题。另外还需注意的是,原始文档里的首行列通常会被当作属性名称看待——除非另有说明才会保留原样显示出来[^3]。 假设我们有份包含日期字符串的电子表格,那么应该执行下面的操作步骤之把它们转成真正的 Date 类型对象: ```m #"Changed Type" = Table.TransformColumnTypes(Source,{{"DateField", type date}}) ``` 同样地,“货币金额”之类的数值也可能需要类似的修正过程。 --- #### 总结 综上所述,借助 Microsoft Power Query 可以轻松完成繁杂耗时的手动编辑任务自动化。无论是简单的格式统还是复杂的模式匹配替换都能找到对应的解决方案。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值