【Python数据分析之pandas04】数学方法

本文介绍了pandas对象在统计与汇总方面的功能,包括与numpy相似的数学方法,如sum方法,并强调在遇到NAN值时的处理方式。通过sum方法可按轴进行运算,设置skipna属性可选择是否忽略NaN。describe方法提供了丰富的汇总信息,包括非数值数据的特殊汇总。此外,还提到了median、mad、skew和kurt等不常见但重要的统计量。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

统计与汇总

    pandas对象的统计基本与numpy的数学方法差不多,不过pandas数组都是基于没有缺失数据的情况下构建的,即当对象中存在NAN值的时候,NaN值将会被自动排除,除非整个切片或对象都是NaN。

    pandas对象的sum方法:

data = pd.DataFrame([[1.4,np.nan],[7.1,-4.5],[np.nan,np.nan],[0.75,-1.3]])
print(data)
'''
  0    1
0  1.40  NaN
1  7.10 -4.5
2   NaN  NaN
3  0.75 -1.3
'''

data.sum()
'''
0    9.25
1   -5.80
dtype: float64
'''

    可以传入对应轴进行运算:

data.sum(axis=1)
'''
0    1.40
1    2.60
2    0.00
3   -0.55
dtype: float64
'''

    如果想要保留NaN值,就修改其skipna属性:

data.sum(axis=1,skipna=False)
'''
0     NaN
1    2.60
2     NaN
3   -0.55
dtype: float64
'''

    pandas还有一个强大的方法describe,可以列出计算汇总的许多重要属性:


                
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值