【Numpy】numpy.lexsort()

最新推荐文章于 2024-04-25 20:07:20 发布

转载最新推荐文章于 2024-04-25 20:07:20 发布 · 1.3w 阅读

Python 专栏收录该内容

368 篇文章

订阅专栏

本文介绍了numpy.lexsort()函数的应用场景及使用方法。通过两个实例详细解析了如何按多个序列进行排序，首先按照次要序列排序，若遇到相同值则根据前一序列继续排序。适用于需要对多列数据进行复杂排序的情况。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

numpy.lexsort()

numpy.lexsort() 用于对多个序列进行排序。把它想象成对电子表格进行排序，每一列代表一个序列，排序时优先照顾靠后的列。

这里举一个应用场景：小升初考试，重点班录取学生按照总成绩录取。在总成绩相同时，数学成绩高的优先录取，在总成绩和数学成绩都相同时，按照英语成绩录取…… 这里，总成绩排在电子表格的最后一列，数学成绩在倒数第二列，英语成绩在倒数第三列。

例一

>>> surnames =    ('Hertz',    'Galilei', 'Hertz')
>>> first_names = ('Heinrich', 'Galileo', 'Gustav')
>>> ind = np.lexsort((first_names, surnames))
>>> ind
array([1, 2, 0])
>>>

>>> [surnames[i] + ", " + first_names[i] for i in ind]
['Galilei, Galileo', 'Hertz, Gustav', 'Hertz, Heinrich']

排序规则：首先按照surnames的字母对应的ascii码大小进行排序，如果出现无法排序的情况，再以first_names 字母对应的ascii码大小进行排序。

那么，本例子中surnames的‘Galilei’比其他小，是第一个，然后'Hertz'和'Hertz'一样大，这时找到first_name中对应位置的数据，并进行排序，明显'Gustav'小于'Heinrich'。所以索引值就为1，2，0.

例二

>>> a = [1,5,1,4,3,4,4] # First column
>>> b = [9,4,0,4,0,2,1] # Second column
>>> ind = np.lexsort((b,a)) # Sort by a, then by b
>>> print(ind)
[2 0 4 6 5 3 1]
>>>

>>> [(a[i],b[i]) for i in ind]
[(1, 0), (1, 9), (3, 0), (4, 1), (4, 2), (4, 4), (5, 4)]