python | 工作笔记 | pandas 常用总结

之前使用pandas处理数据使用的少,最近在实习中经常用到,故自以为把心得总结一番。

说明:有部分是网上查到的案例,觉得很实用,就把它搬过来了。


1.DataFrame的列名

## 方法一:全部修改
df.columns = ['a', 'b', 'c', 'd']
df.columns = df.columns.map(lambda x:x[1:])
df.columns = df.columns.str.strip('$')
## 方法二:可以局部修改
df.rename(columns=('$a': 'a','$e': 'e'}, inplace=True)
df.rename(columns=lambda x:x.replace('$',''), inplace=True)

2.concat拼接

## concat拼接,我常用于处理单个列或行后将数据拼接在一起。
hangye_shouyi_ratio = pd.DataFrame()
for i in range(1,16):
    data_hangye_indexa = hangye_index.iloc[:,i+1].values - hangye_index.iloc[:,i].values
    hangye_shouyi_ratio = pd.concat([hangye_shouyi_ratio,data_hangye_indexa.T],axis=0)

参考网址: http://pandas.pydata.org/pandas-docs/stable/merging.html

3.merge 两个dataframe拼接

# 基于关键词"申万一级行业"拼接两个dataframe
pd.merge(hangye_index,chaopei,on='申万一级行业')

4.计算nan的个数

## 计算NAN或缺失值的个数
df.isnull().sum(axis=1)
## 计算非NAN或缺失值的个数
df.null().sum(axis=1)

5.排序


                
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值