python 报ValueError: Bin labels must be one fewer than the number of bin edges

本文介绍如何使用Python的pandas库正确地将年龄数据进行离散化分组,解决了因分组标签数量与边界不匹配导致的错误,并提供修改后的有效代码。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

在对python数据进行离散化分析时,我想把年龄列进行分组,分成'20-35', '35-50', '50-65', '65-80','80-95','95-110'六组,但是运行时报出了错误ValueError: Bin labels must be one fewer than the number of bin edges,翻译过来的意思是; 分组标签必须比分组的边界少一个

原码是:
labels = ['20-35', '35-50', '50-65', '65-80','80-95','95-110']  #设置的标签
bins=range(20,110,15)  #设置的分组条件,年龄范围是20-110,每一组的间隔为15
use_data['age_group']=pd.cut(use_data.age,bins,right=False,labels=labels) #调用pandas里的cut函数进行计算

错误分析:
因为110恰好是第六组[95,110)的右侧边缘,猜测可能在计算为了保证label里的所有值都能够包含在内,比如此时的值110就无法分类,所以会报故障,把110改成了111就可以了

修改后的程序:
labels = ['20-35', '35-50', '50-65', '65-80','80-95','95-110']
bins=range(20,111,15)
use_data['age_group']=pd.cut(use_data.age,bins,right=False,labels=labels)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

北.海

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值