pandas数据清洗常用操作总结 (一)

操作环境: pandas-0.24.2, jupyter notebook

本教程以加拿大University of New Brunswick的NSL-KDD数据集为操作对象,来进行pandas常用操作总结
包含了数据清理过程中的常用操作, 有些操作只是罗列出来,(需要使用的)对照本教程到pandas官网文档查询。

1 读取数据、查看数据信息

df.info()
样本数量:125973, 特征数量:43
non-null表明没有缺失值
43个特征数据类型:15(float) + 24(int) + 4(object)
在这里插入图片描述
在这里插入图片描述

2 查看数据内容

pd.set_option(‘display.max_columns’, None)
pd.set_option(‘display.max_rows’, None)
pd.set_option(‘max_colwidth’, 44)
df.head(10)
在这里插入图片描述

3 数据描述

df.describe()

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值