python数据预处理

*1. #1.处理缺失数据

##识别出数据中的缺失值:以逗号分隔符(csv)文件为例

import pandas as pd
csv_data=pd.read_csv('./data/mydata.csv')
print(csv_data)

在这里插入图片描述
从输出结果我们可以看到,缺失的单元格数据被NaN所取代

`csv_data.isnull().sum()#输出每列缺失值

##删除缺失值
删除行(删除某个样本)
csv_data.dropna(axis=0)
删除列(删除某个特征)
csv_data.dropna(axis=1)
##填补缺失值
虽然删除缺失值使得数据处理非常分方便,但是缺点还是有的,比如因为删除过多而导致分析边的不可靠,删除太多特征列而导致无法获得有价值的信息。所以建议使用插值技术。

##填补缺失的数据

		均值插补技术:用整个列的均值插补空缺的值
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值