岭回归
岭回归,其实也是一种线性回归。只不过在算法建立回归方程时候,加上正则化的限制,从而达到解决过拟合的效果。
线性回归的损失函数用最小二乘法,等价于当预测值与真实值的误差满足正态分布时的极大似然估计;岭回归的损失函数,是最小二乘法+L2范数,等价于当预测值与真实值的误差满足正态分布,且权重值也满足正态分布(先验分布)时的最大后验估计;LASSO的损失函数,是最小二乘法+L1范数,等价于当预测值与真实值的误差满足正态分布,且权重值满足拉普拉斯分布(先验分布)时的最大后验估计
岭回归在最小二乘法的基础上加上了一个l2l_2l2惩罚项
损失函数:
J(θ)=12m∑i=1m[((hθ(x(i))−y(i))2+λ∑j=1nθj2)]J\left(\theta \right)=\frac{1}{2m}\sum\limits_{i=1}^{m}{[({ {({h_\theta}({ {x}^{(i)}})-{ {y}^{(i)}})}^{2}}+\lambda \sum\limits_{j=1}^{n}{\theta _{j}^{2}})]}J(θ)=2m1i=1∑m[((hθ(x(i))−y(i))2+λj=1∑nθj2)]
正规方程
θ=(X′X+αI)−1X′Y\theta=(X'X+\alpha I)^{-1}X'Yθ=(X′