多重共线性问题

本文探讨了多重共线性在回归类算法中的问题,指出其可能导致参数方差增大、变量显著性检验失效等影响。通过VIF、相关性分析和条件数检验可检测共线性,解决方法包括删除变量、PCA降维、逐步回归及正则化技术如岭回归、Lasso和ElasticNet。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

前言

1、回归类算法(一般线性回归、逻辑回归或者存活分析)都要考虑多个预测因子,故需要考虑多重共线性(multicollinearity)问题。
2、在其他算法中,如决策树和Bayes,DT的建模过程是逐步递进,每次拆分只有一个变量参与,这种建模机制含有抗多重共线性干扰的功能;Bayes假定变量之间是相互独立的, 因此不考虑多重共线性问题。
3、对于多重共线性问题,需要辩证考虑,既不可坐视不管,也不可全然否定。

1、共线性的原理部分

假设有k个自变量的多元线性回归模型
y = β 0 + β 1 x 1 + . . + β k x k + ε = X β + ε y=\beta_0+\beta_1x_1+..+\beta_kx_k+\varepsilon=X\beta+\varepsilon y=β0+β1x1+..+βkxk+ε=Xβ+ε
其中,误差项 ε \varepsilon ε服从 N ( 0 , σ 2 ) N(0,\sigma^2) N(0,σ2)
当矩阵 X X X是满秩时利用最小二乘法进行参数估计得
β ^ = ( X T X ) − 1 X T

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值