解决xgboost报错： ValueError: feature_names mismatch

最新推荐文章于 2025-05-08 23:44:35 发布

原创最新推荐文章于 2025-05-08 23:44:35 发布 · 1.5w 阅读

·

16

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#xgboost #ValueError: feature_names mismatch #报错 #ValueError #feature_names mismatch

报错与BUG 专栏收录该内容

2 篇文章

订阅专栏

博客主要讲述使用XGBoost模型时遇到的问题。在完成模型训练并保存后，后期加载模型用新数据预测，出现ValueError: feature_names mismatch报错。原因是新数据字段顺序与训练时不一致，解决方法是重新排序新数据字段，使其与训练时顺序一致。

部署运行你感兴趣的模型镜像

问题原因

已使用训练数据完成xgboost模型的训练，后期应用时，加载完成模型，使用新数据进行预测时报错。
ValueError: feature_names mismatch，具体如下图。

导致这个问题原因可能有多种情况，我这里对我的情况解释一下。

我这里是由于训练数据划分好，使用的 X_train 训练，后面经验证集 X_test 跑出结果，得到auc都没有问题。
保存好模型。

在后期再应用时，重新加载模型，拿另一批数据进来再跑，比如重新获取的新数据 df_X。
就会出现这个报错。

报错原因是新DataFrame中字段的顺序和之前的不一样。

即使新数据中，字段的总数和所有字段名称能对应上，但是字段顺序对应不上，也会出现这个问题。
xgboost中，如果顺序对应不上，那么加载后预测结果时，默认还是使用以前的顺序，就造成了实际字段不匹配。
出现上面的报错。

解决方法

找到以前训练这个模型时使用的 X_train，使用 X_train.columns
使用下面命令重新给新数据排个序，这样就把新的数据字段顺序和以前训练时使用的字段顺序保持一致。

df_X = df_X[X_train.columns]

把 df_X 再拿去预测，就不会出问题了（当然前提是报错是这个原因，可能有其他原因）。

您可能感兴趣的与本文相关的镜像

Yolo-v5

Yolo-v5

Yolo

YOLO（You Only Look Once）是一种流行的物体检测和图像分割模型，由华盛顿大学的Joseph Redmon 和Ali Farhadi 开发。 YOLO 于2015 年推出，因其高速和高精度而广受欢迎

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。