2.2.1工具篇-Power Query——Power Query从入门到精通

“我花了80%的时间清洗数据,只有20%的时间分析数据。”——这曾是数据分析师的日常写照。直到Power Query的出现,彻底改变了这一工作模式。

一、为什么Power Query是数据分析必备技能?

在正式开始学习之前,让我们先了解Power Query为什么值得你投入时间学习。

1.1 数据准备的现实挑战

在日常数据分析工作中,我们几乎从未遇到过"完美数据"。典型的数据挑战包括:

  • 多源数据:数据分散在Excel、CSV、数据库、Web API等不同来源
  • 脏数据问题:包含空白值、错误值、重复值和不一致格式
  • 结构问题:需要将宽表转换为长表,或者合并多个相关表格
  • 重复劳动:每月、每周甚至每天都需要执行相同的数据清洗步骤

1.2 Power Query的解决方案

Power Query是微软推出的数据连接和数据准备技术,它通过以下方式解决上述问题:

  • 可视化操作:无需编写复杂代码,通过点击界面完成复杂转换
  • 可重复流程:一次构建数据处理流程,可随时刷新应用于新数据
  • 强大集成:深度集成于Excel和Power BI,学习一次,多处应用
  • 性能优化:可处理百万行级别数据,远超传统Excel公式能力

二、Power Query界面全解析

让我们先熟悉Power Query的编辑环境,这是后续所有操作的基础。

2.1 打开Power Query编辑器

在Excel中:

  1. 选择"数据"选项卡
  2. 点击"获取数据"
  3. 选择数据源(如"从工作簿")
  4. 选择具体文件和数据表
  5. 点击"转换数据"打开Power Query编辑器

在这里插入图片描述

2.2 编辑器界面组成

Power Query编辑器分为以下几个关键区域:

  • 功能区:包含所有数据转换命令的上方菜单栏
  • 查询列表:左侧显示当前工作簿中的所有查询
  • 数据预览:中央区域显示当前查询的数据预览
  • 属性面板:右侧显示查询属性和应用步骤
  • 公式栏:可选显示,展示当前步骤的M代码
    在这里插入图片描述

三、从实战开始:销售数据分析案例

让我们通过一个实际案例,逐步掌握Power Query的核心功能。

3.1 案例背景

假设你是一家零售公司的数据分析师,收到了一份销售数据,存在以下问题:

  1. 数据分布在多个工作表中
  2. 日期格式不一致(有的为"2023-01-01",有的为"2023年1月1日")
  3. 产品价格包含货币符号(如"¥100")
  4. 存在空白行和测试数据
  5. 需要计算每个订单的总金额

3.2 数据获取与初步处理

步骤1:连接数据源

在Excel中:

  1. 点击"数据" > “获取数据” > “从文件” > “从工作簿”
  2. 选择你的Excel文件
  3. 在导航器中选择需要的工作表
  4. 点击"转换数据"而不是"加载"

步骤2:提升标题

经常数据的第一行是列名,但Power Query可能将其识别为数据。解决方法:

  1. 在编辑器中,选择"转换"选项卡
  2. 点击"将第一行用作标题"

步骤3:更改数据类型

正确的数据类型至关重要:

  1. 点击列标题旁边的数据类型图标
  2. 选择合适的数据类型(文本、整数、小数、日期等)
  3. 或者选择多列,右键选择"更改类型"
// 对应的M语言代码
= Table.TransformColumnTypes(源,{
  
  {"OrderID", Int64.Type}, 
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值