在对python数据进行离散化分析时,我想把年龄列进行分组,分成'20-35', '35-50', '50-65', '65-80','80-95','95-110'六组,但是运行时报出了错误ValueError: Bin labels must be one fewer than the number of bin edges,翻译过来的意思是; 分组标签必须比分组的边界少一个
原码是:
labels = ['20-35', '35-50', '50-65', '65-80','80-95','95-110'] #设置的标签
bins=range(20,110,15) #设置的分组条件,年龄范围是20-110,每一组的间隔为15
use_data['age_group']=pd.cut(use_data.age,bins,right=False,labels=labels) #调用pandas里的cut函数进行计算
错误分析:
因为110恰好是第六组[95,110)的右侧边缘,猜测可能在计算为了保证label里的所有值都能够包含在内,比如此时的值110就无法分类,所以会报故障,把110改成了111就可以了
修改后的程序:
labels = ['20-35', '35-50', '50-65', '65-80','80-95','95-110']
bins=range(20,111,15)
use_data['age_group']=pd.cut(use_data.age,bins,right=False,labels=labels)
python 报ValueError: Bin labels must be one fewer than the number of bin edges
最新推荐文章于 2025-04-02 15:29:58 发布
本文介绍如何使用Python的pandas库正确地将年龄数据进行离散化分组,解决了因分组标签数量与边界不匹配导致的错误,并提供修改后的有效代码。
部署运行你感兴趣的模型镜像
您可能感兴趣的与本文相关的镜像
HunyuanVideo-Foley
语音合成
HunyuanVideo-Foley是由腾讯混元2025年8月28日宣布开源端到端视频音效生成模型,用户只需输入视频和文字,就能为视频匹配电影级音效
1950

被折叠的 条评论
为什么被折叠?



