LASSO回归
LASSO是由1996年Robert Tibshirani首次提出,该方法是一种压缩估计。与岭回归类似,LASSO也是通过构造一个惩罚函数得到一个性能更好的模型。相比于岭回归,LASSO更极端。它通过惩罚函数压缩回归系数,使得这些回归系数绝对值之和小于某个固定值,甚至将一些重复的没必要的参数直接缩减为0。因此LASSO保留了子集收缩的优点,达到提取有用特征的作用,是一种处理具有复共线性数据的有偏估计。
LASSO回归与岭回归的模型的区别在于岭回归使用的是L2正则,而LASSO回归使用的是L1正则,其目标函数:
f ( w ) = 1 2 m ∑ i = 1 m [ ( y i − x i T w ) 2 + λ ∑ j = 1 n ∣ w j ∣ ] f(w) = \frac{1}{2m}\sum_{i=1}^{m}[(y_{i}-x_{i}^{T}w)^{2}+\lambda \sum_{j=1}^{n}\left |w_{j} \right |] f(w)=2m1∑i=1m[(yi−xi