Lasso回归和岭回归
Lasso回归和岭回归的作用:为线性回归筛选变量、筛选变量、数据降维
1、两个回归的产生原因
在多元线性回归中估计回归系数使用的时OLS,OLS的使用需要满足一个条件:
n*k维数据矩阵的秩 = k 即要求矩阵列满秩,在多重线性回归中为保持回归没有完全多重共线性,需要n>=k,才能保证回归系数能够通过OLS估计出来。
(PS:n指的是样本个数,k指的是指标数)
那么当n<k时,就不能使用OLS估计系数,所以产生Lasso回归的岭回归来解决此种情况。
(PS:但是一般不使用岭回归)
2、lambda的确定方法:最小化均方差预测误差(K折交叉验证)
3、实例:分析棉花产量问题
分析影响棉花产量的最主要原因
使用lasso回归的结果: