
机器学习
文章平均质量分 64
airu
这个作者很懒,什么都没留下…
展开
-
机器学习笔记-概述
机器学习实际上是一个比较古老的领域。这些年突然火了起来,原因很可能是硬件的发展,网络以及数据的 爆发式增长,然后机器学习开始越来越实际,可以帮我们做很多事情。 本博客将记录我学习机器学习的过程以及一些理解。首先选择的是吴恩达大师的课程《机器学习》,这是一门机器学习的入门课程,并不需要太多数学知识,也比较全面,个人比较推荐。 那么机器学习到底是什么鬼? 算法。还是一系列的...2016-08-21 15:12:35 · 206 阅读 · 0 评论 -
机器学习笔记-线性回归
线性回归,从数学上来说是可导函数作为假想模型的机器学习算法中的一种。其主要思想还是概述中的那样。首先寻找特征变量,然后根据已有数据,找到这个可导函数。这里可以发挥数学上的各种线性函数了。这里可能我说的不是很严谨,如此逻辑回归也可能在此。那么我还是把线性回归的假想模型描述下一下: 这里不再从单一变量说起,直接来个高大上的了。这里是多特征变量的,如果我们熟悉(必须熟悉)矩阵向量 ,那么可以...2016-08-27 10:48:35 · 150 阅读 · 0 评论 -
机器学习-线性回归-特征优化
上一篇我们知道了线性回归的理论知识,如果看懂了就有大干一场的冲动。于是上代码,这时,很多问题可能就浮出水面了。 Feature Scaling多个特征变量的情况下,这些特征变量五花八门,数值上从几千到个位数,总觉得不靠谱。这里,NG大神用等高图给我们分析了这种情况,特征变量的差距,只会增加我们的迭代次数,是的学习性能下降。等高图画出来,是个狭长的椭圆,要到圆心自然经历颇多,所以...2016-09-11 10:55:52 · 631 阅读 · 0 评论 -
机器学习-正则化
目前为止我们已经学习了两种机器学习的方法了。如果你去实践,会发现很多问题,其中一项很可能就是过拟合(overfit)的问题。什么是过拟合呢?过拟合就是我们在学习中,对样本的拟合非常好,但是一旦对新的样本就完全失效。这类问题以后还会有分析,究其原因,我们使用模型中某些特征的影响被放大了(多项式高指数),这是我们需要“惩罚”这些特征,是的参数减少。来看下面的例子: Andrew老...原创 2016-10-23 23:10:47 · 297 阅读 · 0 评论