前提提要:
当时在看线性回归时突然被一句话给弄蒙了:当偏差的平方和最小时,该模型函数就是最优的。其实主要疑惑“为什么取平方和最小”,后来虽然接受了这个设定而继续往下看而知道了这是最小二乘法,可“为什么取平方和最小”这个一直让我疑惑(搜到的所有博文、百科等全都没解释这个),直到从头高数复习时在第九章看到了“最小二乘法”才得以明白,于是现总结如下。
PS:原来这个是高数中的知识,我以为至少是概率论呢….
为什么需要线性回归
下面这些是我的理解:
在日常生活中我们无时无刻离不开推测,如:“我头痛发热,则我可能发烧了”、“吊扇转得慢且有异响,则吊扇需要清理或修理了”等等。而这种推测带给我们的好处是显而易见的,于是人们就想:我们能不能把这种推测用到更多的地方,如:“推测明年的房价、推测某个东西的使用寿命、推测某个器具的损耗程度”等等,于是开始像“为了得出发烧这个推测而收集线索:头痛发热”一样,去收集各种各样的数据,最后在这个过程中发现:“咦?如果把某些数据放到坐标轴上的话,则这些点的连线接近于一条直线诶。这样的话只要把这条直线的方程求出来,那我不就能得出任意一个我想要的近似值了吗?”,于是线性回归因此而诞生。
最小二乘法
最小二乘法就是线性回归中的一个,因为在高数中已经说明的很明白了,所以直接放上截图,截图如下