
天池竞赛
Lguide
从事数据行业,沉迷于数据科学中的科研工作者
展开
-
调参方式
LGB的参数集合:bjective = ['regression', 'regression_l1', 'mape', 'huber', 'fair']num_leaves = [3,5,10,15,20,40, 55]max_depth = [3,5,10,15,20,40, 55]bagging_fraction = []feature_fraction = []drop_rat...原创 2020-04-22 20:13:52 · 361 阅读 · 0 评论 -
特征融合(stacking)
特征融合是在参加数据挖掘比赛最后过程中提分的一种重要手段在做结果融合的时候,有一个很重要的条件是模型结果的得分要比较近似,然后结果的差异要比较大,这样的结果融合往往有比较好的效果提升这里主要分享stacking方式import numpyimport pandasimport seaborn as snsimport matplotlib.pyplot as pltfrom skl...原创 2020-04-20 18:40:32 · 3994 阅读 · 0 评论 -
数据挖掘-第一次参加天池比赛-探索性数据分析(EDA)
1.EDA目标EDA的价值主要在于熟悉数据集,了解数据集,对数据集进行验证来确定所获得数据集可以用于接下来的机器学习或者深度学习使用。当了解了数据集之后我们下一步就是要去了解变量间的相互关系以及变量与预测值之间的存在关系。引导数据科学从业者进行数据处理以及特征工程的步骤,使数据集的结构和特征集让接下来的预测问题更加可靠。完成对于数据的探索性分析,并对于数据进行一些图表或者文字总结并打卡。...原创 2020-04-13 20:25:00 · 395 阅读 · 0 评论 -
数据挖掘-第一次参加天池比赛
零基础入门数据挖掘 - 二手车交易价格预测原创 2020-04-12 09:50:20 · 334 阅读 · 0 评论