1. 背景
对采集数据求均值是一种常见简单有效的数据处理手段,比如用直尺去测量物体的长度一般情况会多次测量然后计算平均值然后将平均值作为物体的长度,又如我们需要测量某电源的电压也会采取类似的方法,可以说对数据求均值在我们工作生活中无处不在,但为什么求均值后的测量值会更加接近真实值呢?
2. y=c模型
当你使用直尺去多次测量某物体的长度,然后多次测量后会去计算多次测量后平均值并这个最终的值作为物体的长度;从结果这来说这个这个均值会更加稳定更加接近真实长度,但我们要从原因上解释均值的合理性就需要从测量谈,首先对物体测量结果如下:
在现实生活中由于噪声的存在,无论我们使用多么紧密的测量设备都无法测量得到物体真实的长度,所以测量值与真实值存在以下关系(ei为测量误差):
那么测量误差如下(为了防止误差正负低效,这里对其计算了绝对值):
在最小二乘的观点中,上述所有的误差加起来最小(误差和最小)时x取值就是最靠近真实值,误差和如下:
由于绝对值函数不可导无法使用微积分工具来计算最值,这里将绝对值换算成平方运算

最低0.47元/天 解锁文章
1388

被折叠的 条评论
为什么被折叠?



