一、理解bias和vias
二、如何解决bias和vias大的问题
三、testing error的比较
四、training error和testing error的性质和各自的类比
五:结论:
一、理解bias和vias
Bias:准心(你的准心和靶心的距离)
Variance:准度(你的某次射击位置和准心的距离)
data的bias(数据的偏差):可以理解为个体偏差,因为一次学习用到的数据少,每次学习用到的数据都不同,每次学习的结果都不同。
个体偶然,整体必然。
大数据偏差效应弱,小数据偏差效应强(大数据使得打靶范围缩小了,但仍在正确区域内)
用绝对的大数据所得到的结果,不会有variance
你可以这样理解上面那句话:你把所有的点都画在图上,不就能直接描绘出一条曲线了吗?这条曲线就是靶心,就是真理。(绝对的大数据使得打靶范围,变成了一个点)
简单的model:准心差 ,准度好
原因:
准心差:
(打靶角度理解)简单的model,发挥空间更小,也就是他的打靶范围小,样本再大,也只能找到在这个范围里最好的准心。
(不从打靶角度理解),model太简单,只能在简单model集合里找到最好的结果。
准度好:
(打靶角度理解