详解回归分析中相关变量选择的方法和构建思想——岭回归、LASSO 回归、主成分回归和偏最小二乘回归

本文详细介绍了四种回归分析方法:岭回归、LASSO回归、主成分回归和偏最小二乘回归。岭回归通过加入L2范数惩罚项解决多重共线性问题,但可能导致模型无偏性降低。LASSO回归利用L1范数惩罚项实现变量选择,可将不重要系数缩减为0。主成分回归通过降维处理多变量,减少信息损失。偏最小二乘回归在有标签的回归问题中利用数据相关性进行降维。文章探讨了各方法的原理、参数推导、λ选择及其优缺点。

在线性回归模型中,其参数估计公式为 β = ( X T X ) − 1 X T y , \beta=\left(X^{T} X\right)^{-1} X^{T} y, β=(XTX)1XTy, X T X X^{T} X XTX 不可逆时无法求出 β , \beta, β, 另外,如果 ∣ X T X ∣ \left|X^{T} X\right| XTX 越趋近于 0 , 0, 0, 会使得回归系数趋向于无穷大, 此时得到的回归系数是无意义的。解决这类问题可 以使用岭回归、LASSO 回归、主成分回归、偏最小二乘回归, 主要针对自变量之间存在多重共线性或者自变量个数多于样本量的情况。

一、岭回归

1.1 参数推导

线性回归模型的目标函数
J ( β ) = ∑ ( y − X β ) 2 J(\beta)=\sum(y-X \beta)^{2} J(β)=

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

sta@ma@brain

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值