pandas常用语法小结

最近用pandas处理一些数据的问题,涉及到几个常用语法及其注意事项,在此记录。

1. pd.DataFrame.merge
同JOIN。A、B是两个df,merge之后会返回一个新的df,注意保存
new_df = A.merge(B, on=['key_name', how='outer', indicator=True, suffix=['_A', '_B'])
2. pd.DataFrame.append

同CONCAT。A是最终要返回的总的df,B是每次添加的df,append之后会返回一个新的df,注意保存

A = A.append(B)
3. pd.DataFrame.groupby

同GROUP BY.groupby之后会返回一个新的df,注意保存

df_grouped = df.groupby('col_name')
for col_name, df_ in df_grouped:
    # 对分组后的df进行其他操作
4. pd.DataFrame.apply(function)

对df中的某一(或多)列进行一种操作。function是自定义的操作函数。如果返回多个值,即对df中多列赋值:

def myFun(x):
    return x+10, x*10

df['add_10'], df['mul_10'] = zip(*df['val'].apply(myFun))
5.pd.DataFrame.to_csv()

如果有中文字符,要指定编码格式为utf-8;默认置位符为逗号

df.to_csv('./result.txt', sep='\t', index=None, encoding='utf-8')






评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值