常用pandas操作

最新推荐文章于 2025-06-04 16:07:42 发布

nicholaszt97

最新推荐文章于 2025-06-04 16:07:42 发布

阅读量127

点赞数

文章标签： python

本文链接：https://blog.youkuaiyun.com/weixin_44133727/article/details/103730971

版权

pandas

import pamdas as pd

# 处理列数据，并增加到新的字段。也可覆盖之前的列。
df['列名2'] = df['列名1'].map(lambda x: re.sub('[a-zA-Z()（）-]','',re.sub('\(.*\)','',x)) )

# 筛选符合条件的数据
df[df['列名1'].map(lambda x:False if x in list1 else True)]
df[df['列名1']!=1]

# 级联两个Dataframe，可选横纵级联，默认axis=0、 join='outer'
pd.concat([df1,df2])

# 删除列/多列
df.drop(‘列名’/[‘列名1’,‘列名2’],axis=1,inplace=True)

# 填充空数据
df.fillna('',inplace=True)
dt['列名1'].fillna(dt['列名2'])

# 设置索引，索引排序
df.set_index('列名',inplace=True)
df.sort_index(inplace=True)

# Dataframe转字典
df.to_dict('r') #可选{'dict', 'list', 'series', 'split', 'records', 'index'}模式，写首字母即可。records : list like[{column -> value}, ... , {column -> value}]

# 保存表格，并忽略索引
pd.to_excel('保存路径及文件名',index=False)

df.info() #查看字段有多少条非空 及数据类型
df.describe() #计算列均值等数据
df.dtypes #查看字段数据类型
df.astype('str') #强制转化数据类型