
数据挖掘竞赛
yolin232
这个作者很懒,什么都没留下…
展开
-
Lightgbm调参经验
一周前开始接触Lightgbm,关于它的原理和主要思想很多地方都有,这里就不再赘述。这篇博文是我在参加天池数据挖掘比赛时的Lightgbm调参经验总结,希望对后续的工作有帮助。1. 数据特征选择除了数据集中的基本数据特征外,很多时候还需要从基本数据特征中通过统计或组合获得新的特征,这时候获得的新特征与原来的基本数据特征之间存在着相关性。新特征可能作为基本特征的补充更好地划分数据集,可能与原...原创 2018-04-23 13:40:36 · 8446 阅读 · 2 评论 -
OGeek算法挑战赛总结
断断续续地结束了这个比赛,对我而言,这是入门自然语言处理的第一课,也是搜索推荐中,根据用户query与预测列表prediction_List,预测用户的点击率。参赛总结:1. 首先,json、list相加、读写文件以及一些pandas的操作,都需要用的足够多,才会越熟练。2. 这次遇到的两个最大的挑战是:1)数据泄露;2)进行groupby后,样本乱序对结果产生影响。3. 数据泄露...原创 2018-11-07 11:52:24 · 1514 阅读 · 1 评论