pandas入门(六)

本文深入探讨了Pandas中函数应用和映射的高级用法,包括使用apply方法对DataFrame进行操作,以及如何利用sort_index和sort_values进行高效的数据排序。此外,还介绍了如何对数据进行排名。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

上一篇:pandas入门(五)

函数应用和映射

NumPy的ufuncs(元素级数组方法)可用于操作pandas对象
在这里插入图片描述

=====================================
另一个常见的操作是,将函数应用到由各列或行所形成的一维数组上。DataFrame 的apply方法即可实现此功能。函数f,计算了一个Series的最大值和最小值的差,在frame的每列都执行了一次。结果是一个Series,使用frame的列作为索引。
在这里插入图片描述

=====================================
如果传递axis='columns’到apply,这个函数会在每行执行。许多最为常见的数组统计功能都被实现成DataFrame的方法(如sum和mean),因此无需使用apply方法
在这里插入图片描述

=====================================
传递到apply的函数不是必须返回一个标量,还可以返回由多个值组成的Series
在这里插入图片描述

=====================================
元素级的Python函数也是可以用的
想得到frame中各个浮点值的格式化字符串,使用applymap即可
在这里插入图片描述

=====================================
叫做applymap,是因为Series有一个用于应用元素级函数的map方法
在这里插入图片描述

排序和排名

根据条件对数据集排序(sorting)也是一种重要的内置运算
要对行或列索引进行排序(按字典顺序),可使用sort_index方法,它将返回一个已排序的新对象
在这里插入图片描述

=====================================
对于DataFrame,则可以根据任意一个轴上的索引进行排序
在这里插入图片描述

=====================================
数据默认是按升序排序的,但也可以降序排序
在这里插入图片描述

=====================================
若要按值对Series进行排序,可使用其sort_values方法
在这里插入图片描述

=====================================
在排序时,任何缺失值默认都会被放到Series的末尾
在这里插入图片描述

=====================================
当排序一个DataFrame时,你可能希望根据一个或多个列中的值进行排序。将一个 或多个列的名字传递给sort_values的by选项即可达到该目的
在这里插入图片描述

=====================================
根据多个列进行排序,传入名称的列表即可
在这里插入图片描述

=====================================
排名会从1开始一直到数组中有效数据的数量。
默认情况下,rank是通过“为各组分配一个平均排名”的方式破坏平级关系
在这里插入图片描述

=====================================
根据值在原数据中出现的顺序给出排名
在这里插入图片描述

=====================================
按降序进行排名
在这里插入图片描述

=====================================
DataFrame可以在行或列上计算排名
在这里插入图片描述

++++++++++++++++++++++++++++++++++++

下一篇:pandas入门(七)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值