关于Lasso回归本身的文章已经数不胜数了,比如这一篇https://blog.youkuaiyun.com/xiaozhu_1024/article/details/80585151 我就觉得写的蛮好,概念清晰,也有代码在里面可以参考。但是在Python中应用sklearn.linear_model
.Lasso时总会遇到一个问题:惩罚项系数alpha需自定义,而往往我们在面对未知问题时无法很好地去自定义这样一个alpha,于是我们注意到LassoCV这一方法,我将先理解性地翻译一遍官方文档的主要内容,以便加深理解,并结合自己遇到的问题进行一些分析。
官方文档地址:https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LassoCV.html
LassoCV是沿着正则化路径迭代拟合的Lasso线性模型,主要就是基于Lasso的方法,加上KFold交叉验证来自动帮我们找出最优的alpha取值以及其对应最优模型。Lasso 的最优化目标函数是:(1 / (2 * n_samples)) * ||y - Xw||^2_2 + alpha * ||w||_1
函数本身需要传入的参数非常多,一般用默认值即可,主要需要用户自己设