关于MATLAB处理大数据坐标文件2017527

本文分享了在随机森林算法中调整特征数量与决策树数量的经验。通过对比实验发现,当决策树的数量适当且不超过特征数量的1.5倍时,模型的准确性更高。此外,文章还介绍了如何从失败案例中提炼新特征来进一步提高模型表现。

第一次提交数据:

今天用了8个特征,加上的这一个特征是 从3000条测试数据中测试失败的数据总结出来的
树的数目为50
再次使用3000条测试数据测试结果—— 结果不错: 99%
但是运行官网数据结果分数——降低0.5      为58.55分



总结:总特征数目为8,树的数目远远超过特征数,以后树的数目不能多于特征的1.5倍,否则结果很难得出结论,无说服力

 

 

第二次提交数据:

本次使用9个特征,加上的特征是 从3000条测试数据中测试失败的数据总结出来的

树的数目为12

使用3000条测试数据测试结果—— 结果不错: 99%

运行官网数据结果分数有所提升

 

总结:总特征数目为9,树的数目12,正确率上升,事实说明 :一个没有特征的决策树会也会抽取数据训练 , 最终也会对随机森林最终结果产生影响

        那么继续观察以前的失败数据,提取新的特征

 

转载于:https://www.cnblogs.com/jjuiipg2017/p/6913648.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值