其中
为第i组数据的independent variable,
为第i组数据的dependent variable,
为系数向量。
最小二乘法,如上所示。
可能有人感觉直接对求偏导比较方便。但是我们根据normal equation 可以得知
θ=
,这时的计算量很大,同时注意此时矩阵也很大(求逆也计算也不小)。
此时使用梯度下降法或者梯度上升法我们仅仅把数字输入,进行简单的计算即可。
同时θ的变化很小时,我们可以自动终止。
如果需要更详细的资料建议:http://www.zhihu.com/question/20822481,其中前两个答案联合解释的比较清晰。
本文探讨了梯度下降法在机器学习领域的应用,对比了它与最小二乘法的优缺点,并提供了使用梯度下降法解决实际问题的实例。
950

被折叠的 条评论
为什么被折叠?



