
algorithm
小星爷
共同学习研究机器学习和相关算法,此外对大数据处理感兴趣的也可以交流学习。Spark hadoop.
擅长JAVA语言,开发过Android客户端,小型网站。
展开
-
正则化(线性回归)
正则化这部分是结合统计机器学习的(李航)和吴恩达的机器学习视频写的,有什么不对的地方欢迎指出啊!当数据量少,特征也少的时候,我们训练的模型是欠拟合,这时候我们会通过交叉验证来弥补。 当数据量少,特征非常多的时候,容易出现过拟合,这时要通过正则化调整。1. 过拟合还是来看预测房价的这个例子,我们先对该数据做线性回归,也就是左边第一张图。如果这么做,我们可以获得拟合数据的这样一条直线,但是,实际上这并原创 2017-10-28 10:52:59 · 11334 阅读 · 1 评论 -
熵,交叉熵,KL散度的理解
源博客参考:https://colah.github.io/posts/2015-09-Visual-Information/#fn1什么是熵,什么是信息熵?在机器学习中一直都很难理解,最近读了一篇博客,它用可视化的方法帮助我们更好的理解什么是信息熵。可视化概率分布首先举个例子,这个例子在后文中也会用到。假设我在重庆,有时候它会下雨,但是大多数时候是晴天,下雨的概率大概是25%,晴天的概率是...原创 2019-04-03 12:00:15 · 1459 阅读 · 1 评论