数据挖掘
文章平均质量分 76
moshlwx
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【总结】IJCAI-17 口碑商家客流量预测参赛总结
说是总结其实更多是教训,成绩不好。 关键词搜进来的想来学习的朋友可能要失望了。。。原创 2017-03-15 18:14:08 · 7002 阅读 · 8 评论 -
【数据挖掘】【笔记】之sklearn.ensemble
ensemble methods组合几个不同的模型结果以增强泛化能力和鲁棒性。In averaging methods, 原则是建立几个独立的模型,对结果取均值,可以降低方差(取均值可降低方差的原因:平均可以平滑曲线)Examples: Bagging methods, Forests of randomized trees, …By contrast, in boosting methods,原创 2017-06-25 21:19:26 · 2005 阅读 · 0 评论 -
【数据挖掘】【笔记】模型集成之ensembling guide
KAGGLE ENSEMBLING GUIDEhttp://mlwave.com/kaggle-ensembling-guide原创 2017-06-25 21:20:31 · 644 阅读 · 0 评论 -
【数据挖掘】【笔记】数据预处理之类别特征编码
定义类别特征:如['male', 'female']等,模型不能直接识别的数据。处理的目的是将不能够定量处理的变量量化。 特别的比如星期[1, 2, ... , 7]虽然是数字,但是数值之间没有大小顺序关系,需要视为类别特征。处理编码为模型可识别的数值型特征。根据模型处理能力的不同,需要考虑单纯映射为数值或哑变量编码。原创 2017-06-25 21:21:26 · 2457 阅读 · 0 评论 -
【数据挖掘】【笔记】阅读之机器学习竞赛进阶
教你如何在机器学习竞赛中更胜一筹(上)-博客-云栖社区-阿里云 https://yq.aliyun.com/articles/73755?spm=5176.100239.bloglist.40.wxgxxt介绍一些建立机器学习模型的技巧问答原创 2017-06-25 21:25:15 · 463 阅读 · 0 评论 -
【数据挖掘】【笔记】阅读之数据挖掘比赛基本流程
【干货】Kaggle 数据挖掘比赛经验分享 http://mp.weixin.qq.com/s/BE1mfmKJTsDSwWi16mllNA数据分析,数据清洗,特征工程,模型训练和验证等四个大的模块数据分析原创 2017-06-25 21:25:57 · 583 阅读 · 0 评论 -
【数据挖掘】【总结】项目总结之KDD2017
KDD CUP 2017从四月开始做,到今天(0508)已经做了一段时间,成绩目前虽然较以前有了不少提升,但距离顶尖还有不少距离。最近把想到的好实现的东西都实现了,效果也都不错,但是貌似遇到了瓶颈,现在捋一捋思路,看看还有什么地方可以继续提高。由于目前只做了volume的部分,所以下文中只涉及vol。Data Analysize接触到数据,首先做了一些简单的分析和可视化。然后定了基本思路。原创 2017-06-25 21:21:58 · 3952 阅读 · 2 评论
分享