Topic:
- 为什么需要岭回归?
- 岭回归如何防止模型出现过拟合
- 岭回归代码
一、为什么需要岭回归?
(1) 线性回归不好?
线性回归主要根据 最小二乘法
那么,哪里出了问题呢?
- 最小二乘法的目标:使得训练集中的真实集与回归模型的估计值的均方差最小;
- 我们的目标:测试集中的真实值与回归模型的估计值的差异最小
举个栗子:
有一系列参数 wi w i
w0 w 0 | w1 w 1 | w2 w 2 | w3 w 3 | w4 w 4 |
---|---|---|---|---|
1 | 1 | 1 | 1 | 6 |
当 w4 w 4 过大,且其他参数对其影响很微小时候,那么这个 w4 w 4 独裁
即,只要 w4 w 4 稍微变动都会对最后的值产生重大影响,导致均方差波动很大。
那么如何防止 w4 w 4 这个变量独裁呢?
如果内部无法调控,那么就从外部入手,给它加个“手柄”( λ∑ni=1(wi)2 λ ∑ i = 1 n ( w i ) 2 )
FRidge=