- 博客(5)
- 收藏
- 关注
原创 从0开始实现bagging算法和random forest 算法和成为调包侠
当然在文章末尾,我们依然会采用sklearn库来写随机森林和bagging算法。我们采用bagging/randomforest均是采用概率,我们选取概率最大的。好啦,这就是我全部的内容,接下来,我们成为“调包侠”,使用sklearn来处理。其次,随机森林对最大特征采取开方处理,这是和bagging之间的差距。前面写完决策树的model,我们接着来看看决策树的应用。接下来,我来创建随机森林model,这里我要赘述一些。创建数据集之后,我们会查看我们数据集长什么样子,首先,我们来创建数据集。
2025-03-03 12:56:50
344
原创 使用sklearn实现c45,CART
如果大家想要进行调优,可以划分验证集出来,然后采用网格搜索/随机网格搜索就ok,这里我就不在赘述了。我们仔细观察数据集,主观上来看,Name,passengerid和ticket与预测关系不大。--------此时,我突然想玩独热编码,因此为了有独热编码而有独热编码的操作。but,c45要求我们的输入离散值,但是age和fare就是连续的。发现还是有部分是返回True,也就是,还有部分是存在缺失值的。但是,好像没有重复值,but,无伤大雅,没有重复就没有重复。ok,填充结束了,此时的特征工程完成了大部分,
2025-02-28 14:14:30
438
原创 load_metric:ImportError: name ‘load_metric‘ cannot import 已解决
load_metric:ImportError: name 'load_metric' cannot import 已解决
2025-02-18 13:26:57
447
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人