自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 从0开始实现bagging算法和random forest 算法和成为调包侠

当然在文章末尾,我们依然会采用sklearn库来写随机森林和bagging算法。我们采用bagging/randomforest均是采用概率,我们选取概率最大的。好啦,这就是我全部的内容,接下来,我们成为“调包侠”,使用sklearn来处理。其次,随机森林对最大特征采取开方处理,这是和bagging之间的差距。前面写完决策树的model,我们接着来看看决策树的应用。接下来,我来创建随机森林model,这里我要赘述一些。创建数据集之后,我们会查看我们数据集长什么样子,首先,我们来创建数据集。

2025-03-03 12:56:50 344

原创 使用sklearn实现c45,CART

如果大家想要进行调优,可以划分验证集出来,然后采用网格搜索/随机网格搜索就ok,这里我就不在赘述了。我们仔细观察数据集,主观上来看,Name,passengerid和ticket与预测关系不大。--------此时,我突然想玩独热编码,因此为了有独热编码而有独热编码的操作。but,c45要求我们的输入离散值,但是age和fare就是连续的。发现还是有部分是返回True,也就是,还有部分是存在缺失值的。但是,好像没有重复值,but,无伤大雅,没有重复就没有重复。ok,填充结束了,此时的特征工程完成了大部分,

2025-02-28 14:14:30 438

原创 将模型转换为ONNX格式所出现的device不统一的问题(已解决)

将模型转换为ONNX格式所出现的device不统一的问题(已解决)

2025-02-24 13:12:22 127

原创 load_metric:ImportError: name ‘load_metric‘ cannot import 已解决

load_metric:ImportError: name 'load_metric' cannot import 已解决

2025-02-18 13:26:57 447

原创 nltk中使用punkt,Lookuperror已解决

nltk中使用punkt,Lookuperror已解决

2025-02-18 12:17:45 392

从0 实现C45和使用sklearn实现c45,CART

数据集,在github上也可以下载

2025-02-28

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除