pandas数据分析49-58

最新推荐文章于 2025-03-12 18:09:53 发布

原创最新推荐文章于 2025-03-12 18:09:53 发布 · 235 阅读

·

1

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

python 数据分析专栏收录该内容

17 篇文章

订阅专栏

本文介绍了Pandas中的对齐运算，包括如何避免产生NAN值的相加，以及混合运算中的广播机制。同时，讲解了函数的应用，如applymap()和apply()在列或行上的应用。此外，还涉及了排序、丢弃和填充缺失数据、层级索引的操作，以及统计计算和描述性统计量的计算方法。

对齐运算

对Series或者DataFrame直接进行相加，会产生一个并集，相同的序列相加，不同的序列为NAN。
在这里插入图片描述

如果不想要产生NAN，而是使用填充值，则需要使用方法，并传入参数fill_value = 0：
在这里插入图片描述

DataFrame和Series相同

add 加
radd 加（反转参数）

在这里插入图片描述
注意，reindex不会影响原来的对象，而是会返回一个新对象

混合运算

广播机制

在这里插入图片描述

如果想要在列方向进行运算，需要使用方法，传入指定轴：

在这里插入图片描述

函数的应用

numpy的函数pandas都能用，除此之外还有一些函数：

通过apply将函数应用到列或者行：

apply()函数，默认是在列方向

pd4.apply(f,axis = 1)

applymap()

通过applymap将函数应用到每个数据上

在这里插入图片描述

排序

按索引排序sort_index()

s1.sort_index() #默认升序
s1.sort_index(ascending = False) #降序

在这里插入图片描述

按照值排序 sort_values()

默认从小到大排序，当有缺失值的时候，默认排在最后

对DataFrame使用sort_values()方法，需要传入指定的列 by = x:
在这里插入图片描述

唯一值

s2 = s1.unique() #返回一个唯一值数组

值的个数

s1.value_counts()

判断是否存在

s2.isin([8，2]) #判断8或者2是否在s1

丢弃缺失数据

pd1.dropna() # 默认丢弃行
pd1.dropna(axis = 1) #丢弃列

填充缺失数据 fillna()

pd1.fillna(2) #将指定数据填入缺失值

层级索引

生成和取值

在这里插入图片描述

交换层级

在这里插入图片描述

统计计算和描述

pd1.sum() 求和，默认按列求和
pd1.sum(axis = 1) 按照行求和
pd1.sum(skipna = False) 不排除空值
pd1.idxmax() 返回最大值的索引
pd1.cumsum() 累计求和
pd1.describe() 显示汇总统计

评论 5

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。