pandas数据的排序

本文基于Python的pandas库,介绍了如何对数据和索引进行排序。主要讲解了.sort_index()方法用于按索引排序,.sort_values()方法用于按数据排序,两者都在默认升序的基础上支持降序排列。在排序过程中,NaN值会被自动放置到末尾。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

本文的主要内容是基于中国大学mooc(慕课)中的“Python数据分析与可视化”课程进行整理和总结。
在介绍数据排序之前,我们先对数据理解建立一个感性的认识,我们知道一组数据可以表达一个或者多个含义,我们需要一个完整的运算过程来得到数据的含义,我们把这个简单的运算过程称为摘要,摘要就是数据在形成特征的过程中采用有损的形式获得的一些结果,我们能够通过摘要获得以下信息:

  • 基本统计(含排序)
  • 分布/累计统计
  • 相关性和周期性的数据特征
  • 深入数据挖掘,形成知识

严格上来说,我们不可能使用每一个数据的绝对值构成知识,通过数据构建知识的过程中一定是有损的,损失的多与少就形成了摘要的不同结果,摘要的第一个过程就是需要对数据进行排序,下面介绍数据排序的基本方法。
在pandas库中,无论是Series还是DataFrame类型,不仅可以对数据,还能对索引进行操作,所以在对数据进行排序两个方面,pandas提供了两个方法。

操作索引的排序方法

.sort_index()方法在指定轴上根据索引进行排序,默认升序,该方法并非对数据进行排序运算,而是对数据对应索引进行排序运算。
.sort_index(axis=0,ascending=True),其中ascending=True表示默认递增排序。

b = pd.DataFrame(np.arange(20).reshape(4,5), index=['c', 'a', 'd', 'b'])
b
	0	1	2	3	4
c	0	1	2	3	4
a	5	6	7	8	9
d	10	11	12	13	14
b	15	16	17	18	19
b.sort_index(axis=0, ascending=True)
	0	
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值