[中奖]第九届“泰迪杯”挑战赛A题
数据挖掘挑战赛:样本不平衡下的特征选择与模型优化
于 2021-07-18 18:15:35 首次发布
本文探讨了在数据挖掘比赛中,面对样本严重不均衡的财务造假预测任务,如何通过 NullImportances 方法进行特征选择,以及如何调整模型策略如使用互信息、树模型权重和SMOTE来改善模型性能。作者分享了针对不同行业数据(无造假与有造假)的特征重要性计算策略和模型融合技巧,包括制造业与非制造业的案例分析。


最低0.47元/天 解锁文章
9236

被折叠的 条评论
为什么被折叠?



