基本操作
python进行数据处理的一系列基本操作
数据导入导出
- 导入pandas库
import pandas as pd
- 导入csv格式的数据
#error_bad_lines忽略存在错误的行
df = pd.read_csv('test.csv',error_bad_lines=False)
- 写出csv格式的数据
df.to_csv('final.csv', index=False)
- 读取csv时,由于缺失值引起的浮点转换问题
pd.read_csv('test.csv')
这样会对字符串型的数据,加上.0的浮点处理,例如Id类型的数据
但是,如果你告诉pandas你想要有缺失值的新实验整数,即可解决该问题:
pd.read_csv('test.csv', dtype={
'a': 'Int64'})
列表操作
- 删除指定列
df=df.drop(['D0401b','D_0'],axis=1)
- 分列
#先将字段变为字符串形式,再按照分隔符进行分列

这篇博客介绍了使用Python进行数据处理的基本操作,包括数据导入导出、列表操作等。讲解了如何处理CSV数据,如导入导出、缺失值处理,以及如何进行列表操作,如删除列、分列、计算列间运算、删除重复行、改变列顺序、数据分列到行等。此外,还探讨了Pandas的数据匹配方法,如内连接、左连接、右连接和外连接,以及如何筛选和统计数据,修改列名和进行groupby聚合操作。
最低0.47元/天 解锁文章
1910

被折叠的 条评论
为什么被折叠?



