python 报ValueError: Bin labels must be one fewer than the number of bin edges

最新推荐文章于 2025-04-02 15:29:58 发布

原创最新推荐文章于 2025-04-02 15:29:58 发布 · 1.4w 阅读

5 ·

CC 4.0 BY-SA版权

文章标签：

#python #ValueError #bin labels #bin edges

python 专栏收录该内容

28 篇文章

订阅专栏

本文介绍如何使用Python的pandas库正确地将年龄数据进行离散化分组，解决了因分组标签数量与边界不匹配导致的错误，并提供修改后的有效代码。

部署运行你感兴趣的模型镜像

在对python数据进行离散化分析时,我想把年龄列进行分组，分成'20-35', '35-50', '50-65', '65-80','80-95','95-110'六组，但是运行时报出了错误ValueError: Bin labels must be one fewer than the number of bin edges，翻译过来的意思是; 分组标签必须比分组的边界少一个

原码是：
labels = ['20-35', '35-50', '50-65', '65-80','80-95','95-110'] #设置的标签
bins=range(20,110,15) #设置的分组条件，年龄范围是20-110，每一组的间隔为15
use_data['age_group']=pd.cut(use_data.age,bins,right=False,labels=labels) #调用pandas里的cut函数进行计算

错误分析：
因为110恰好是第六组[95,110)的右侧边缘，猜测可能在计算为了保证label里的所有值都能够包含在内，比如此时的值110就无法分类，所以会报故障，把110改成了111就可以了

修改后的程序：
labels = ['20-35', '35-50', '50-65', '65-80','80-95','95-110']
bins=range(20,111,15)
use_data['age_group']=pd.cut(use_data.age,bins,right=False,labels=labels)