xgboost算法的学习小案例

博客介绍了如何解决XGBoost训练集与测试集特征维度不匹配的问题,通过详细解释`feature_names mismatch`错误并提供Python和Pandas中数据类型的转化方法,包括将预测结果转换为DataFrame,修改列名以确保一致性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

# xgboost
#预测集直接从pandas转入就行
data_predict2 = data_predict.ix[:, 2:]
#训练集的特征与对应的标签
dtrain = xgb.DMatrix(data_train.ix[:, :-1], label=data_train.ix[:, -1], missing=np.nan)
#训练的时候看的观测值,跟训练集是一样的
dwatch = xgb.DMatrix(data_watch.ix[:, :-1], label=data_watch.ix[:, -1], missing=np.nan)
#把预测的pandas转为Dmatrix
dtest = xgb.DMatrix(data_predict2, missing=np.nan)

dtrain2 = xgb.DMatrix(data_2hour_stack, label=data_2hour_label_stack, missing = np.nan)
dtest2 = xgb.DMatrix(data_2hour_test_stack, missing = np.nan)
#对应的参数调整
param = {
  
  
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值