python之dataframe需要注意的细节

最新推荐文章于 2023-12-06 20:37:45 发布

Lida_wu

最新推荐文章于 2023-12-06 20:37:45 发布

阅读量467

点赞数

CC 4.0 BY-SA版权

分类专栏：个人日志编程练习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/u013004700/article/details/94393516

个人日志同时被 2 个专栏收录

26 篇文章

订阅专栏

16 篇文章

订阅专栏

本文详细介绍使用Pandas进行数据处理的高级技巧，包括按列名分组并计算平均值而不将其设为索引、删除含有缺失值的行、设置多级索引、对数据进行归一化处理、统计特定字段出现的次数等实用操作。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

（1）通过as_index=False，groupby的列名'GLBDOMAIN'将不作为索引出现在结果中

agv_1930_df=data_1930_df.groupby(['GLBDOMAIN'],as_index=False)[['EDGE_BW']].mean()

（2）按行删除存在缺失数据的行（dataframe）

data_1930_df.dropna(axis=0,how='any',inplace=True)

（3）设置其中一列或者多列为dataframe的索引

data_1930_df=data_1930_df.set_index('GLBDOMAIN')

data_1930_df=data_1930_df.set_index(['GLBDOMAIN','Time'])

（4）Axis=0为行，axis=1为列，特别注意在对数据进行操作的时候要进行指定

original_avg_1930_bw=data_1930_df.apply(lambda x:x.mean(),axis=1)

（5）更改dataframe的列名

data_1930_df.columns=['GLBDOMAIN','2019-06-01 19:30']

（6）对dataframe的每一行分别进行归一化，先对数据进行行列转置，然后在对每一列进行归一化处理

def regularit(df):

newDataFrame = pd.DataFrame(index=df.index)

columns = df.columns.tolist()

for c in columns:

d = df[c]

MAX = d.max()

MIN = d.min()

newDataFrame[c] = ((d - MIN) / (MAX - MIN)).tolist()

return newDataFrame

##########

data_1930_df=data_1930_df.T
data_1930_df=regularit(data_1930_df)

（7）统计次数并且修改列名
peakPOP_num_df=peakPOP_df.groupby(['date','POP英文名'])[['POP英文名']].size().reset_index(name='counts')

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。