pandas数据的排序

最新推荐文章于 2025-10-16 08:37:01 发布

原创

最新推荐文章于 2025-10-16 08:37:01 发布 · 706 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#python #机器学习 #大数据 #数据分析 #数据挖掘

本文基于Python的pandas库，介绍了如何对数据和索引进行排序。主要讲解了.sort_index()方法用于按索引排序，.sort_values()方法用于按数据排序，两者都在默认升序的基础上支持降序排列。在排序过程中，NaN值会被自动放置到末尾。

本文的主要内容是基于中国大学mooc（慕课）中的“Python数据分析与可视化”课程进行整理和总结。
在介绍数据排序之前，我们先对数据理解建立一个感性的认识，我们知道一组数据可以表达一个或者多个含义，我们需要一个完整的运算过程来得到数据的含义，我们把这个简单的运算过程称为摘要，摘要就是数据在形成特征的过程中采用有损的形式获得的一些结果，我们能够通过摘要获得以下信息：

基本统计（含排序）
分布/累计统计
相关性和周期性的数据特征
深入数据挖掘，形成知识

严格上来说，我们不可能使用每一个数据的绝对值构成知识，通过数据构建知识的过程中一定是有损的，损失的多与少就形成了摘要的不同结果，摘要的第一个过程就是需要对数据进行排序，下面介绍数据排序的基本方法。
在pandas库中，无论是Series还是DataFrame类型，不仅可以对数据，还能对索引进行操作，所以在对数据进行排序两个方面，pandas提供了两个方法。

操作索引的排序方法

.sort_index()方法在指定轴上根据索引进行排序，默认升序，该方法并非对数据进行排序运算，而是对数据对应索引进行排序运算。
.sort_index(axis=0,ascending=True)，其中ascending=True表示默认递增排序。

b = pd.DataFrame(np.arange(20).reshape(4,5), index=['c', 'a', 'd', 'b'])
b

	0	1	2	3	4
c	0	1	2	3	4
a	5	6	7	8	9
d	10	11	12	13	14
b	15	16	17	18	19

b.sort_index(axis=0, ascending=True)

	0	1	2	3	4
a

最低0.47元/天解锁文章