
机器学习实战
TangowL
这个作者很懒,什么都没留下…
展开
-
美团团购单交易额预估问题
本文转载自美团点评技术团队文章http://tech.meituan.com/mt-mlinaction-how-to-ml.html转载 2016-03-18 09:45:25 · 4496 阅读 · 1 评论 -
美团点击下单率预测问题(以数据清洗与特征处理为主)
本文转载自美团点评技术团队文章http://tech.meituan.com/rerank_solution_offline.html。转载 2016-03-18 11:20:08 · 6230 阅读 · 0 评论 -
机器学习实战开始啦!
机器学习算法、Python语言、推荐算法和数据库的学习也有一段时间了,打算开始找些小的比赛或者项目练练手,进行一些实战。我会把实战的背景、目标、模型、算法、代码和结果等都整理下来,陆续放在博客中,算是对自己知识的整理吧,有兴趣的朋友也可以看看一起讨论学习。另外,由于很多比赛和项目是由第三方提供的,我会仔细核查是否有规定不允许公开讨论相关内容,只有在确定没有限制的情况下,我才会放在个人博客上,但难免会原创 2016-04-17 15:11:19 · 1144 阅读 · 1 评论 -
天池_阿里音乐流行趋势预测大赛(1) —— 赛题分析
本文以天池大数据竞赛的阿里音乐流行趋势预测大赛为背景,将机器学习实战的背景、模型、算法、代码和结果等都整理下来,放在博客中,算是对自己知识的整理吧,有兴趣的朋友也可以看看一起讨论学习。由于很多比赛和项目是由第三方提供的,我会仔细核查是否有规定不允许公开讨论相关内容,只有在确定没有限制的情况下,我才会放在个人博客上,但难免会有疏漏,如果有侵权,请及时联系本人,麻烦了。原创 2016-06-01 21:23:33 · 5296 阅读 · 1 评论 -
分布式机器学习的故事
王益博士,称得上机器学习领域的资深从业者,本人之前有幸拜读过王益博士的一些paper和slides,对其从事的“分布式机器学习”方向尤感兴趣。王益博士之前写过一篇《分布式机器学习的故事》,总结了自己从业多年的经验和感悟。可惜的是,这篇原始博文已经删除了,现在能找到的是原始的六篇讲稿素材:A New Era;Infrequent itemset mining;Application Driven;Im原创 2016-11-07 12:08:58 · 12666 阅读 · 6 评论 -
逻辑斯蒂回归中特征共线性或强相关的影响
理论解释共线性,指多元回归模型中,各自变量之中至少有两个完全或高度相关。一方面,自变量之间的强相关,虽不会影响对应回归系数的大小,但会扩大其回归系数的方差。由于回归系数比上标准差,即检验该回归系数是否显著的 t 值。由于 t 值的降低,导致回归系数不显著,将无法拒绝一个错误的零假设。另一方面,自变量之间的强相关,可能导致回归系数的正负方向与真实的相反,影响特征的可解释性。可以认为 ...原创 2018-09-06 21:05:24 · 8892 阅读 · 1 评论