在许多文章中都有提到最小二乘的应用以及性质介绍,但是很少看到有人用数学的方式解释为什么是最小二乘而不是其他的函数。
接下来我将一步一步地浅谈一下我对最小二乘思路的理解。
首先是从贝叶斯理论出发,通过什么是似然函数,为什么要最大化似然函数,再利用高斯分布的maximum likelihood function 来推导出最小二乘的损失函数J
接下来我将一步一步地浅谈一下我对最小二乘思路的理解。
首先是从贝叶斯理论出发,通过什么是似然函数,为什么要最大化似然函数,再利用高斯分布的maximum likelihood function 来推导出最小二乘的损失函数J
由于文本编辑的原因,我就直接利用word截图了。
作者才刚开始学习这一块内容,定有许多错误,希望大家指出。
参考文献:
1.《机器学习》周志华
2.《pattern recognition and machine learning》 C.Bishop
3.cs229讲义 Andrew Ng