
数据挖掘
l_yiyu
这个作者很懒,什么都没留下…
展开
-
Datawhale零基础入门数据挖掘-Task4 建模调参笔记
Task4 建模调参一.常见模型1.1 线性回归模型参考博客:线性回归1.2 决策树模型参考博客:决策树模型1.3 GBDT模型参考博客:GBDT1.4 XGBoost模型参考博客:XGBoost模型1.5 LightGBM模型参考博客:LightGBM模型推荐教材:《机器学习》 《统计学习方法》 《Python大战机器学习》 《面向机器学习的特征工程》 《数据科...原创 2020-04-01 22:13:58 · 543 阅读 · 1 评论 -
Datawhale零基础入门数据挖掘-Task3 特征工程笔记
1. 特征工程特征工程是比赛中最至关重要的的一块,特别的传统的比赛,大家的模型可能都差不多,调参带来的效果增幅是非常有限的,但特征工程的好坏往往会决定了最终的排名和成绩。特征工程的主要目的还是在于将数据转换为能更好地表示潜在问题的特征,从而提高机器学习的性能。比如,异常值处理是为了去除噪声,填补缺失值可以加入先验知识等。特征构造也属于特征工程的一部分,其目的是为了增强数据的表达。有些比赛的...原创 2020-03-28 21:53:01 · 269 阅读 · 0 评论 -
Datawhale零基础入门数据挖掘-Task2数据分析笔记
<Datawhale 零基础入门数据挖掘-Task2 数据分析 > - 笔记脑图:2.1 EDA目标EDA的价值主要在于熟悉数据集,了解数据集,对数据集进行验证来确定所获得数据集可以用于接下来的机器学习或者深度学习使用。当了解了数据集之后我们下一步就是要去了解变量间的相互关系以及变量与预测值之间的存在关系。引导数据科学从业者进行数据处理以及特征工程的步骤,使数据集的结构和特...原创 2020-03-24 21:59:39 · 390 阅读 · 0 评论