同时包含一范数和二范数的公式求解问题

原创已于 2022-03-17 20:07:48 修改 · 2.1k 阅读

3 ·

CC 4.0 BY-SA版权

文章标签：

#机器学习

于 2022-03-17 17:45:45 首次发布

sparse 专栏收录该内容

5 篇文章

订阅专栏

Iterative Shrinkage Thresholding Algorithm （ISTA）求解

现有目标函数：
$f(x)=\frac{1}{2} \parallel \boldsymbol{b}-\mathbf{A}\boldsymbol{x} \parallel_2^2 + \lambda | \boldsymbol{x}- \boldsymbol{u}|$
其中的变量都为向量，求 $\boldsymbol{x}$ 的解

将这样一个问题转化为标量形式
$f(x)=\frac{1}{2} ( x-x_0)^2 + \lambda | x- u|$
式子中有绝对值，需要分类讨论这个问题

当 $x - u > 0$ 即 $x > u$ 时
$f(x)=\frac{1}{2} ( x-x_0)^2 + \lambda (x- u)$
有
$f'(x)=x-x_0 + \lambda$
令 $f^{'} (x) = 0$ ，则
$x=x_0 - \lambda$
前提是需要满足 $x > u$ ，即 $x_0 - \lambda >u$
所以当 $x_0 > u+\lambda$ 时 $x=x_0 - \lambda$
同理，当 $x - u < 0$ 即 $x < u$ 时
$f(x)=\frac{1}{2} ( x-x_0)^2 - \lambda (x- u)$
有
$f'(x)=x-x_0 - \lambda$
令 $f^{'} (x) = 0$ ，则
$x=x_0 + \lambda$
前提是需要满足 $x < u$ ，即 $x_0 + \lambda <u$
所以当 $x_0 < u-\lambda$ 时 $x=x_0 + \lambda$

综上，
$\begin{cases} x_0 + \lambda, \qquad x_0 < u-\lambda \\ u , \qquad u-\lambda \leq x_0 \leq u+\lambda\\ x_0 - \lambda, \qquad x_0 > u+\lambda \end{cases}$
这里解释一下，中间值为什么是 $u$ ，将边界值 $x_0=u+\lambda$ 代入到 $x=x_0-\lambda$ 中，以及 $x_0=u-\lambda$ 代入到 $x=x_0+\lambda$ 中, 恰好可以得到 $x = u$
以自变量为 $x_0$ , 应变量为 $x$ ，画出函数图像是这样的

这其实就是一个软阈值函数，用符号 $S(\cdot)$ 来表示, 定义为
$S_{\lambda, u}(t)= \begin{cases} t + \lambda, \qquad t < u-\lambda \\ u , \qquad u-\lambda \leq t \leq u+\lambda\\ t - \lambda, \qquad t > u+\lambda \end{cases}$

则上式的解可以表示为
$x=S_{\lambda, u}(x_0)$
这里的 $x_0$ 是二次项的极值。

让我们回到目标函数：
$f(x)=\frac{1}{2} \parallel \boldsymbol{b}-\mathbf{A}\boldsymbol{x} \parallel_2^2 + \lambda | \boldsymbol{x}- \boldsymbol{u}|$
二次项的导数为（如果不会求导的详见这里）
$\frac{\partial f_1(x)}{\partial x}=A^T(Ax-b)$

则梯度下降求其迭代解（非闭式解）为
$x^{(t+1)}=x^{(t)} - \frac{1}{c} \boldsymbol{A}^T(\boldsymbol{A}\boldsymbol{x}-\boldsymbol{b})=\boldsymbol{x}^{(t)} + \frac{1}{c} \boldsymbol{A}^T(\boldsymbol{b}-\boldsymbol{Ax})$
所以将上式代入软阈值函数里可得