Python手写Lasso回归算法

数据科学家修炼之道

已于 2023-12-02 08:11:27 修改

阅读量9.6k

点赞数 1

CC 4.0 BY-SA版权

分类专栏： AI # 机器学习文章标签：机器学习

于 2018-07-26 22:56:11 首次发布

本文为博主原创文章，欢迎转载，转载请注明出处。

本文链接：https://blog.youkuaiyun.com/xiligey1/article/details/81229225

文章目录

理论
Python实现

理论

Lasso回归在最小二乘法的基础上加上了一个 $l_1$ 惩罚项

损失函数： $J(\theta)=\frac 1 {2m}\sum_{i=1}^m(h_{\theta}(x^{(i)})-y^{(i)})^2+\lambda \sum_{j=1}^n|\theta_j|$

相比岭回归可以直接通过矩阵运算得到回归系数相比，LASSO的计算变得相对复杂。由于惩罚项中含有绝对值，此函数的导数是连续不光滑的，所以无法进行求导并使用梯度下降优化。

两种求解Lasso回归的方法：

坐标下降法
最小角回归

坐标下降法

坐标下降法，是沿着坐标轴的方向去下降。

坐标下降法的数学依据是：

一个可微的凸函数 $J(\theta)$ ，其中 $\theta$ 是 $n * 1$ 的向量，即有 $n$ 个维度。如果在某一点 $\overline \theta$ ，使得 $J(\theta)$ 在每一个坐标轴 $\overline \theta_i(i=1,2,...,n)$ 上都是最小值，那么 $J(\overline \theta_i)$ 就是一个全局最小值

于是，我们的优化目标是：在 $\theta$ 的 $n$ 个坐标轴上，对损失函数做迭代的下降，当所有的坐标轴上的 $\theta_i(i=1,2,...,n)$ 都收敛，此时损失函数最小，此时的 $\theta$ 即为我们要求的结果。

具体算法流程：

1、首先，初始化 $\theta$ 向量，随机取值即可，即为 $\theta^{(0)}$ ，上面的括号里的数字表示当前迭代的轮数。

2、对于第 $k$ 轮的迭代，我们从 $\theta_1^{(k)}$ 开始，到 $\theta_n^{(k)}$ 为止，依次求 $\theta_i^{(k)}$ 。 $\theta_i^{(k)}$ 的表达式如下：

$\theta_i^{(k)} \in \underbrace{argmin}_{\theta_i} J(\theta_1^{(k)}, \theta_2^{(k)}, ... \theta_{i-1}^{(k)}, \theta_i, \theta_{i+1}^{(k-1)}, ..., \theta_n^{(k-1)})$