Lasso回归和岭回归

本文介绍了Lasso和岭回归在解决多重共线性问题时的作用,重点讲述了lambda的确定方法——K折交叉验证。通过实例分析棉花产量问题,展示了Lasso回归在变量筛选上的优势。此外,还概述了Lasso回归的使用步骤,包括变量的标准化、VIF检查以及回归分析。附录部分详细阐述了OLS、岭回归和Lasso回归的原理。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >


Lasso回归和岭回归的作用:为线性回归筛选变量、筛选变量、数据降维

1、两个回归的产生原因

在多元线性回归中估计回归系数使用的时OLS,OLS的使用需要满足一个条件:
n*k维数据矩阵的秩 = k 即要求矩阵列满秩,在多重线性回归中为保持回归没有完全多重共线性,需要n>=k,才能保证回归系数能够通过OLS估计出来。
(PS:n指的是样本个数,k指的是指标数)

那么当n<k时,就不能使用OLS估计系数,所以产生Lasso回归的岭回归来解决此种情况。

(PS:但是一般不使用岭回归)

2、lambda的确定方法:最小化均方差预测误差(K折交叉验证)

在这里插入图片描述

3、实例:分析棉花产量问题

分析影响棉花产量的最主要原因
在这里插入图片描述
使用lasso回归的结果:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值