这个看起来高大上的系列注解文章,到这个阶段便是最重要的部分了。有人说,人工智能就是概率论与统计学,实际上我也认为差不多,代码只是实现人工智能的工具,内部的原理是概率论的知识。
1 残差平方和
1.1 残差
所谓残差,就是实际值与估计值的差。百度百科说,如果回归模型正确的话, 我们可以将残差看作误差的观测值。
1.2 残差平方和
在平时我们求回归方程的时候,不会每一个点都在回归方程上,因为我们需要用连续的平滑曲线模拟趋势,从而将坐标上的离散点联系起来。也因此,我们将离散点看做真实值,将回归曲线上的点看做预测值,预测值与真实值的差的平方就是残差平方,再将他们加起来,最终得到的结果就是残差平方和。
用矩阵形式表示的残差平方和为:
一组数据的残差平方和越小,说明该曲线拟合程度越高</