数据挖掘
DataVVhale
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Ensemble Learning Task 10
学习地址:https://github.com/datawhalechina/team-learning-data-mining/tree/master/EnsembleLearningTask 10 的主要学习内容是 前向分布算法与梯度提升决策树前向分布算法与梯度提升决策树1. 前向分布算法1.1 加法模型1.2 前向分布算法2梯度提升决策树(GBDT)2.1 基于残差学习的提升树算法2.2 梯度提升决策树算法(GBDT)1. 前向分布算法1.1 加法模型加法模型的基本思想是将不同的模型线性相加原创 2021-04-23 23:48:09 · 283 阅读 · 0 评论 -
HeartbeatClassification Task 5
学习地址:https://github.com/datawhalechina/team-learning-data-mining/tree/master/HeartbeatClassificationTask 5 学习内容:模型融合第五部分,模型融合。在结束了以上四个目标之后,我们进入最后的模型融合部分。基于不同的方向,我们有不同的融合策略:结果层面的融合通过对结果得分进行加权融合、log、exp等不同的操作,我们可以对模型进行结果层面的融合。有一个很重要的条件是模型结果的得分要比较近似原创 2021-03-28 23:41:36 · 150 阅读 · 0 评论 -
HeartbeatClassification Task 4
学习地址:https://github.com/datawhalechina/team-learning-data-mining/tree/master/HeartbeatClassificationTask 4 学习内容:模型调参本模块主要学习内容包含以下几个部分:逻辑回归模型树模型集成模型模型对比与性能评估模型调参模型方面,主要介绍了逻辑回归与决策树模型的优缺点,这里不再赘述。集成学习部分从样本选择样例权重预测函数以及并行计算四个方面介绍了Baggin与Boosting的区别。模型对原创 2021-03-25 20:48:28 · 158 阅读 · 0 评论 -
Ensemble Learning Task 3
Ensemble Learning Task 3学习地址:https://github.com/datawhalechina/team-learning-data-mining/tree/master/EnsembleLearningTask 3 的主要学习内容是 掌握偏差与方差理论这一部分内容主要是优化基础模型,分为以下几个部分:训练均方误差与测试均方误差偏差方差的权衡特征提取压缩估计(正则化)降维第一部分主要是通过对训练与测试的均方误差进行比较,从评价指标的角度对过拟合现象进行深入原创 2021-03-22 23:56:23 · 182 阅读 · 0 评论 -
HeartbeatClassification Task3
学习地址:https://github.com/datawhalechina/team-learning-data-mining/tree/master/HeartbeatClassificationTask 3 学习内容:特征工程基于上一节对数据的EDA过程,这一节我们对数据进行特征工程操作。本次数据的缺失和异常是无需处理的,更为重要的是特征的抽取和选择。首先,我们将train和test数据进行拼接,用以同时进行特征抽取处理。在一些数据极为稀疏的场景,如果不对两部分数据同时进行处理,极为可能会得到原创 2021-03-22 18:07:02 · 128 阅读 · 0 评论
分享