pandas.qcut进行数据分组,找到靠前或者靠后的数据

本文详细介绍了Pandas库中的qcut函数使用方法及如何获取分组边界。qcut函数能够将数据集划分成等频区间,并返回Categories类型数组。文章还提供了获取区间左边界与右边界的方法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

https://stackoverflow.com/questions/44088460/interval-datatype-in-pandas-find-midpoint-left-center-etc


pandas.qcut函数返回Categories类型,包含了interval类型的数组。

>>> bins=pd.qcut(range(5), 4)
>>> bins
[(-0.001, 1.0], (-0.001, 1.0], (1.0, 2.0], (2.0, 3.0], (3.0, 4.0]]
Categories (4, interval[float64]): [(-0.001, 1.0] < (1.0, 2.0] ...
>>>bins[1].left
-0.001
>>>bins[1].right
1.0

那么通过left和right就可以找到边界。

其实qcut函数返回的是Categorical,直接可以当做新列插入到dataframe中。并不能拿到分组的边界数值。

如果想知道分组的上下边界,只能通过groupby分组只有min或者max来获得。





评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值