Pandas —— rank( )函数进行排名

最新推荐文章于 2025-10-16 08:37:01 发布

转载最新推荐文章于 2025-10-16 08:37:01 发布 · 6.2w 阅读

文章标签：

#python #pandas

Pandas 专栏收录该内容

29 篇文章

订阅专栏

本文介绍了Python中pandas库的rank函数用法，包括不同排序方法（如平均排名、最小排名、最大排名和首次出现排名），升序和降序排序，以及在Series和DataFrame上的应用。还展示了如何通过axis参数指定排序轴。

部署运行你感兴趣的模型镜像

rank( )

rank函数返回从小到大排序的下标

1、默认情况下，rank是通过“为各组分配一个平均排名”的方式破坏平级关系的

In [120]:obj = pd.Series([7,-5,7,4,2,0,4])
In [121]:obj.rank()
Out [121]:
0    6.5
1    1.0
2    6.5
3    4.5
4    3.0
5    2.0
6    4.5
dtype: float64

2、根据值在原数据中出现的顺序排名

In [122]:obj.rank(method='first')
Out [122]:
0    6.0
1    1.0
2    7.0
3    4.0
4    3.0
5    2.0
6    5.0
dtype: float64

3、按降序进行排名

In [123]:obj.rank(ascending=False, method='max')
Out [123]:
0    2.0
1    7.0
2    2.0
3    4.0
4    5.0
5    6.0
6    4.0
dtype: float64

4、若对DataFrame进行排序，则可根据axis指定要进行排序的轴

In [136]: frame=pd.DataFrame({'b':[5,7,-3,2],'a':[0,1,0,1],'c':[-2,5,8,-3]})

In [137]: frame
Out[137]:
   a  b  c
0  0  5 -2
1  1  7  5
2  0 -3  8
3  1  2 -3

In [138]: frame.rank(axis=0)
Out[138]:
     a    b    c
0  1.5  3.0  2.0
1  3.5  4.0  3.0
2  1.5  1.0  4.0
3  3.5  2.0  1.0

In [139]: frame.rank(axis=1)
Out[139]:
     a    b    c
0  2.0  3.0  1.0
1  1.0  3.0  2.0
2  2.0  1.0  3.0
3  2.0  3.0  1.0

method方法的选项

Tables	Are
average	默认：在相等分组中，为各个值分配平均排名
min	使用整个分组的最小排名
max	使用整个分组的最大排名
first	按值在原始数据中的出现顺序分配排名

转载地址：

《利用Python进行数据分析》

您可能感兴趣的与本文相关的镜像

Facefusion

AI应用

FaceFusion是全新一代AI换脸工具，无需安装，一键运行，可以完成去遮挡，高清化，卡通脸一键替换，并且Nvidia/AMD等显卡全平台支持

5 条评论

weixin_38504606 2019.08.13
为什么rank之后值改变了啊
- weixin_41436637回复weixin_38504606 2019.09.02
  [reply]weixin_38504606[/reply] [code=python] In [120]:obj = pd.Series([7,-5,7,4,2,0,4]) In [121]:obj.rank() Out [121]: 0 6.5 # index=0代表的是obj第一个数7,7在obj中排名第6和第七，取平均值6.5 1 1.0 # index=1代表obj第二个数-5.-5在obj中排名第1，取值1 2 6.5 # index=3依次计算，类推 3 4.5 4 3.0 5 2.0 6 4.5 dtype: float64 [/code]

菜鸟营-炊事员 2019.01.26
这不就是把书上的东西搬上了吗?能加点您的解释吗
- starter_zheng回复菜鸟营-炊事员 2019.01.26
  [reply]qq_42979261[/reply] 这个只是我在看书的时候做的一个整理记录。因为rank()这个api本身内容比较简单，总共就5个参数，所以没有什么扩展的空间。axis（指定轴），method（指定方法），ascending（指定升降序），na_option（指定Nan值的排名方式），pct（计算数据的百分比排名）。后两个参数很少用到所以没加进去，如果有什么疑惑的地方我们可以交流一下，我也可以加到我的博客里面，谢谢。

进击的taisuke 2018.11.27
博主，能具体讲讲什么叫做使用整个分组的最大排名好人最小排名啊？就是 method(max,first)
- starter_zheng回复进击的taisuke 2018.11.28
  [reply]qq_42462075[/reply] 假如有数组(7,-5,7,4,2,0,4)，按从小到大进行排名，若数值相同，则按先后顺序进行排名，那么就有(6,1,7,4,3,2,5)。其中7(排名有6和7)和4(排名有4和5)，若取最大排名max，则7取排名7，4取排名5，则有(7,1,7,5,3,2,5)。取最小排名min，则7取排名6，4取排名4，则有(6,1,6,4,3,2,4)