【数据预处理】Python数据预处理常见操作

本文详述了Python数据预处理的关键步骤,包括数据查看、转换、清洗、获取、合并和其他操作,如异常值处理、重复值检测、缺失值填充等,旨在帮助读者掌握高效的数据预处理技巧。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

  文章总结了拿到原始数据后,用Python做数据预处理的常见操作。后续会根据总结不断更新。

一、数据查看

  查看行列: data.shape
  查看数据详细信息: data.info(),可以查看是否有缺失值
  查看数值型数据详细信息: data.describe(),可以查看到异常数据
  获取前/后10行数据: data.head(10)、data.tail(10)
  查看列标签: data.columns.tolist()
  查看行索引: data.index
  查看数据类型: data.dtypes
  查看数据维度: data.ndim
  查看除index外的值: data.values,会以二维ndarray的形式返回DataFrame的数据
  查看数据分布(箱线图): seaborn.boxplot(data[列名])
  查看数据分布(直方图): seaborn.distplot(data[列名].dropna())

二、数据转换

  改变行索引: data.set_index(‘日期’,inplaec=True),将“日期”列设置为新的索引
  修改列名排序: data.reindex(columns = new_columns_list)
  字符串变时间: pd.to_datetime(data[‘日期’]),pd.read_csv(‘路径’,parse_date=[‘日期’])
  

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值