【RL初学-2】处理分段线性的Lyapunov函数的Subgradient方法

原创已于 2025-11-01 17:14:19 修改 · 663 阅读

CC 4.0 BY-SA版权

文章标签：

于 2024-11-25 22:08:47 首次发布

3 篇文章

订阅专栏

Subgradient方法是一种用于解决非光滑凸优化问题的迭代算法。与传统的梯度下降法不同，subgradient方法适用于目标函数不一定可微的情况。

凸函数：一个函数 $\mathbb{R}^n \rightarrow \mathbb{R}$ 是凸的，如果对所有 $\in \mathbb{R}^n$ 和 $λ∈[0,1]\lambda \in [0, 1]$ ，都有
$f(λx+(1−λ)y)≤λf(x)+(1−λ)f(y).f(\lambda x + (1 - \lambda) y) \leq \lambda f(x) + (1 - \lambda) f(y).$
subgradient：对于一个非光滑函数 $f$ ，一个向量 $g$ 称为 $f$ 在点 $x$ 的subgradient，如果对于所有 ( $y$ ) 都有

$\geq f(x) + g^T (y - x).$

这意味着 ( $g$ ) 可以视为在 ( $x$ ) 点的“斜率”，用于描述函数在该点的变化情况。
subdifferential：函数 ( $f$ ) 在点 ( $x$ ) 的subdifferential，记作 ( $∂f(x)\partial f(x)$ )，是所有subgradient的集合。

Subgradient方法的基本步骤如下：

初始化：
- 选择一个初始点 ( $x_0$ )。
- 选择步长序列 $αk{\alpha_k}$ ，一般要求 ( $αk>0\alpha_k > 0$ )。
迭代：
- 对于每个迭代 ( $\ldots$ )，执行以下步骤：
  1. 计算subgradient ( $gk∈∂f(xk)g_k \in \partial f(x_k)$ )。
  2. 更新点：
    
    $xk+1=xk−αkgk.x_{k+1} = x_k - \alpha_k g_k.$
停止条件：
- 当满足某个停止条件（如达到最大迭代次数或目标函数收敛）时停止迭代。