机器学习——岭回归和LASSO回归

本文探讨了多元线性回归中遇到的多重共线性问题,介绍了岭回归(Ridge Regression)作为解决方案,包括如何通过岭迹图选择合适的岭参数,并讨论了岭回归在变量筛选中的作用。此外,还提到了LASSO回归,一种通过一阶惩罚函数减少模型复杂度,特别适合处理多重共线性数据的方法。弹性网(Elastic Net)作为结合岭回归和LASSO特性的方法也被提及。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1.用矩阵表示多元线性回归

Y=BX+a

Q(B)=(Y-BX)T(Y-BX)达到最小时的B值。

也即是残差平方和最小时。B(Bi)的值。可以证明B的最小二乘估计=(XTX)-1XTy

其中(XTX)-1为广义逆。

如果X存在线性相关的话,XTX没有逆:

    1.出现多重共线性2.当n<p,变量比样本多时,出现奇异

岭回归(Ridge Regression)

先对数据做标准化

B(K)=(XTX+kI)XTY为B的岭回归估计,其中K为岭参数,I为单位矩阵,KI为扰动。

岭迹图帮助我们发现多重共线性,以及取那个K值。在图中,k很小时,B很大,k稍微增大,B迅速变小,肯定有多重共线性。多重共线性的岭迹图一般呈喇叭口状。选喇叭附近的k值。

岭迹图可以筛选变量,有个变量的系数长期很接近于

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值