一、功能:
两者功能相似,都是将一个Series切割成若干个分组
api 可以看官网详细介绍,大致如下:
pandas.qcut(x, q, labels=None, retbins=False, precision=3, duplicates='raise')
pandas.cut(x, bins, right=True, labels=None, retbins=False, precision=3, include_lowest=False, duplicates='raise')
其中最常用的有个三个参数, x -代表数据集,这里一般是Series
q -为一个整数或数组,代表切割成几组或者具体的切割方式
labels -代表切割后的分组名称
返回值是一个 Categorical 类型,是一个可迭代对象,其中即包含了一个series,即 x中每个元素的分组标记。还包含了整体的分组情况。
二、区别
qcut 是等频切割,即基本保证每个组里的元素个数是相等的
cut是按值切割,即根据数据值的大小范围等分成n组,落入这个范围

本文介绍了pandas中的cut和qcut函数,用于将Series数据进行分组。cut按值切割,根据数据大小范围分为n组,qcut则是等频切割,确保各组元素数量接近。通过示例展示了这两个函数的使用方法和结果差异。
最低0.47元/天 解锁文章
805

被折叠的 条评论
为什么被折叠?



