使用Excel表格进行数据清理

本文介绍了Excel表格在数据清理过程中的实用技巧,包括调整样式、处理缺失值、删除重复值、一致化处理和查找异常值等步骤。通过具体的操作指南,帮助读者掌握如何有效地清洗和整理数据。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Excel表格可以用来学习初级的数据分析。有一些数据清理阶段遇到的小技巧,在此记录一下。
数据清理主要的工作步骤是:调整样式→删除重复值→处理缺失值→一致化处理→数据排序→异常值处理

调整样式
  1. 打开Excel表之后乱码:
    造成乱码的原因和编程中时常遇到的字符编码出错是同一个道理,一般是因为导进来的时候本来表格是用csv或者是文本的形式,这样编码方式是阿斯卡码,而不是utf-8,总之目标是将utf-8的格式赋给表格里的数据。
    :选择“数据”→“从文本/css”,按照指引步骤完成导出转换
  2. 进入表格后发现原来的表格里面有很多冗余的空白行,删又删不掉
    :选中空白栏第一行,然后按ctrl+shift+↓ 可以一路选完下面的所有行,右键选择删除,保存文件退出重进。
  3. 调整表格的宽度让表格变得容易看,在开始→自动换行
  4. 隐藏掉不需要的列,在列名上右键点隐藏。
处理缺失值
  1. 处理缺失值有几种可选的做法:
  • 删掉整行,丢弃数据
  • 利用前后的平均值估算并且补齐数据
  • 利用已知的信息尝试填写数据
  • 标注缺失
  1. 到缺失的值,选出一整列或一整行然后在开始→查找与选择→定位条件→空值,可以锁定选中的行或者列中的空值,填补空值,按ctrl + Enter可以将一次填补的内容赋到所有空格里。
  2. 删除重复值:找到主键,因为主键应当唯一,然后选择数据→删除重复值
一致化处理
  1. 进行分列,要注意分列这个操作会覆盖掉后面的一列,所以要先把要分列的列复制到表格最后列,然后把原来的列隐藏,对新的列全选,数据→分列,然后选其他,输入与分隔数
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值