numpy pandas 数据处理操作总结

本文总结了Numpy和Pandas在数据处理中的常用操作,包括打开文件、文件合并、排序、数值统计、isin函数应用、分布直方图绘制、空值检查、去除重复行、归一化处理及数组拼接等。通过这些技巧,可以有效地对数据进行管理和分析。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

  1. 打开文件
a = pd.read_csv('a.txt', header = None, sep = '[_\t]+')

header控制文件中是否包含列名,sep控制划分方式,可使用正则表达式

  1. 文件合并
c = pd.concat([a,b])

列相同的两个文件纵向连接

  1. 文件排序
a = a.sort_values(['col1','col2'])

先根据列’col1’的值进行排序,'col1’值相同的再根据’col2’的值进行排序

  1. 数值统计
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值