sklearn接口的xgboost 分类器:
xgboost.XGBClaaifier()
xgboost.fit(x,y)
1. xgboost.predict(test_x)
2. xgboost.predict_proba(test_x)
3. xgboost.score(test_x,y)
讨论:
结果1“可能”不准,因为predict默认采用0.5做阈值;另外,score也是利用0.5做阈值计算的分数。
而如果根据predict_proba,我们分析不同阈值下的正确率分数,会发现在某些阈值下,正确率分数会更高。
非sklearn接口的xgboost分类器:
xgboost.train()
xgboost.predict() 只会输出概率或sigmoid转换前的贡献度model_a.predict(pred_contribs= True),需要人工指定阈值,才能做分类。

探讨了sklearn接口和非sklearn接口下XGBoost分类器的使用方法,指出默认阈值可能影响预测准确性,并建议通过分析不同阈值下的正确率来优化分类效果。
10万+

被折叠的 条评论
为什么被折叠?



