R语言rank函数详细解析

最新推荐文章于 2024-05-20 14:07:41 发布

幸运六叶草

最新推荐文章于 2024-05-20 14:07:41 发布

阅读量2.4w

点赞数 9

CC 4.0 BY-SA版权

分类专栏： R

本文链接：https://blog.youkuaiyun.com/AnneQiQi/article/details/60878551

本文详细解析R语言中的rank函数，包括函数作用、使用场景和排序类型。通过示例说明如何处理相同值的排序，以及na.last和ties.method参数的影响。rank函数可用于对数值或因子向量进行排序，提供了平均、最大、最小和随机等多种处理相同值的策略。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

前言：在R中，和排序相关的函数主要有三个：sort()，rank()，order()。
sort(x)是对向量x进行排序，返回值排序后的数值向量。rank()是求秩的函数，它的返回值是这个向量中对应元素的“排名”。而order()的返回值是对应“排名”的元素所在向量中的位置。

下面以一小段R代码来举例说明：

> x<-c(97,93,85,74,32,100,99,67)
> sort(x)
[1]  32  67  74  85  93  97  99 100
> order(x)
[1] 5 8 4 3 2 1 7 6
> rank(x)
[1] 6 5 4 3 1 8 7 2

1.rank函数是什么

rank相关文档[1]可以译为"返回原数组(?)中各个元素排序(?)后的秩次(?)"，表面上看确实可以得到次序，但对数组、排序、秩次交待不清。

2.rank函数使用情景

比如，在100米赛跑中，甲乙丙三人的成绩为6.8s, 8.1s, 7.2s，那么用rank函数排序获得名次：

> rank(t <- c(6.8, 8.1, 7.2))
[1] 1 3 2

再如，甲乙丙三人考试得分为74,92,85，用同样方法取得名次会适得其反。当然，我们可以认为执行

> rank(-(s <- c(74, 92, 85)))
[1] 3 1 2

可以达到目的，但这并未改变rank函数的排序机制。

3.rank函数排序类型

rank(x, na.last = TRUE,
ties.method = c("average", "first", "random", "max", "min"))

> t <- c(4, NaN, 4, 7, 8, 2, NaN, 9, 9, 7, NaN, 5, 2, 2, 1)
#同时对相应元素做好标记
> names(t) <- letters[1 : length(t)]

通过以上方法进行排序，得出

200万优质内容无限畅学