pandas
import pamdas as pd
# 处理列数据,并增加到新的字段。也可覆盖之前的列。
df['列名2'] = df['列名1'].map(lambda x: re.sub('[a-zA-Z()()-]','',re.sub('\(.*\)','',x)) )
# 筛选符合条件的数据
df[df['列名1'].map(lambda x:False if x in list1 else True)]
df[df['列名1']!=1]
# 级联两个Dataframe,可选横纵级联,默认axis=0、 join='outer'
pd.concat([df1,df2])
# 删除列/多列
df.drop(‘列名’/[‘列名1’,‘列名2’],axis=1,inplace=True)
# 填充空数据
df.fillna('',inplace=True)
dt['列名1'].fillna(dt['列名2'])
# 设置索引,索引排序
df.set_index('列名',inplace=True)
df.sort_index(inplace=True)
# Dataframe转字典
df.to_dict('r') #可选{'dict', 'list', 'series', 'split', 'records', 'index'}模式,写首字母即可。records : list like[{column -> value}, ... , {column -> value}]
# 保存表格,并忽略索引
pd.to_excel('保存路径及文件名',index=False)
df.info() #查看字段有多少条非空 及数据类型
df.describe() #计算列均值等数据
df.dtypes #查看字段数据类型
df.astype('str') #强制转化数据类型