预处理共轭梯度法(PCG)

最新推荐文章于 2025-02-20 19:52:14 发布

OORRANNGGE

最新推荐文章于 2025-02-20 19:52:14 发布

阅读量2.1w

点赞数 14

分类专栏：数值优化文章标签： SLAM

数值优化专栏收录该内容

2 篇文章

订阅专栏

开始读研了，研究方向是SLAM。SLAM中很重要的一部分是位姿估计，需要用到一些优化算法对位姿进行优化。预处理共轭梯度法PCG(Preconditioned Conjugate Gradient)是一种SLAM中常用的位姿优化算法，从共轭梯度法（Conjugate Gradient）衍生而来，用于快速计算最优值。

直接求解

假设有一个线性方程：
$\textbf{A}\textbf{x} = \textbf{b}$

其中 $A$ 是一个已知的对称且正定的矩阵，b也已知。记 $\textbf{x}_*$ 为方程的唯一解。如果两个非零向量 $\textbf{u,v}$ 满足：
$\textbf{u}^{\rm T}\textbf{A}\textbf{v} = 0$

则称 $\textbf{u}$ 和 $\textbf{v}$ 共轭（相对于 $\textbf A$ )。共轭是一种对称的关系，如果 $\textbf u$ 对于 $\textbf v$ 共轭，那么 $\textbf v$ 对于 $\textbf u$ 共轭。
由于 $\textbf{A}$ 对称且正定，于是可以定义內积：
$\langle \textbf{u},\textbf{v} \rangle_{\textbf{A}} := \langle \textbf{A}\textbf{u},\textbf{v} \rangle = \langle \textbf{u},\textbf{A}^{\rm T}\textbf{v} \rangle = \langle \textbf{u},\textbf{A}\textbf{v} \rangle = \textbf{u}^{\rm T}\textbf{A}\textbf{v}$

如果有一个矩阵 $\textbf{P}$ ：
$\textbf{P} = \left\{\textbf{P}_{1},\textbf{P}_{2},....,\textbf{P}_{n}\right\}$

且 $\textbf{P}$ 中的列向量两两共轭，那么 $\textbf{Ax} = \textbf{b}$ 的解 $\textbf{x}_{*}$ 可以写成：
$\textbf{x}_{*} = \sum\limits_{i=1}^{n}\alpha_{i}\textbf{P}_{i}$

于是，
$\textbf{A}\textbf{x}_{*} = \sum\limits_{i=1}^{n}\alpha_{i}\textbf{A}\textbf{P}_{i}$

左乘 $\textbf{P}_{k}^{\rm T}$ :
$\textbf{P}_{k}^{\rm T}\textbf{A}\textbf{x}_{*} = \sum\limits_{i=1}^{n}\alpha_{i}\textbf{P}_{k}^{\rm T}\textbf{A}\textbf{P}_{i}$

将 $\textbf{A}\textbf{x} = \textbf{b}$ 和 $\textbf{u}^{\rm T}\textbf{A}\textbf{v} = \langle \textbf{u},\textbf{v} \rangle_{\textbf{A}}$ 代入得：
$\textbf{P}_{k}^{\rm T}\textbf{b} = \sum\limits_{i=1}^{n}\alpha_{i}\langle\textbf{P}_k，\textbf{P}_i\rangle_{\textbf{A}}$

因为 $\textbf{u}^{\rm T}\textbf{v} = \langle \textbf{u},\textbf{v} \rangle$ ,且对于 $\forall i\not= k:\langle \textbf{u},\textbf{v}\rangle_{\textbf{A}} = 0$ ,所以：

$\langle \textbf{P}_{k},\textbf{b}\rangle = \alpha_{k}\langle \textbf{P}_{k},\textbf{P}_{k}\rangle_{\textbf{A}}$

由此可以得到 $\alpha_{k}$ 的表达式：
$\alpha_{k} = \frac{\langle \textbf{b}_{k},\textbf{b}\rangle}{\langle \textbf{P}_{k},\textbf{P}_{k}\rangle_{\textbf{A}}}$

结合 $\textbf{x}_{*} = \sum\limits_{i=1}^{n}\alpha_{i}\textbf{A}\textbf{P}_{i}$ 就可以求解 $\textbf{x}_{*}$ 。
当 $n$ 很大时，用直接法求解就会非常耗时，于是引出迭代法。

迭代法

为了求得 $\textbf{x}_{*}$ 的一个很好的近似，我们并不需要全部的 $\textbf{P}_{k}$ ，当 $n$ 很大且 $\textbf{A}$ 又具有一定的稀疏性时，可以用迭代法来求得一个近似的结果。令 $\textbf{x}_{*}$ 的初始估计值为 $\textbf{x}_{0}$ ( $\textbf{x}_{0}=\textbf{0}$ ,etc.)。
构建二次函数：

$\frac{1}{2}\textbf{x}^{\rm T}\textbf{A}\textbf{x} - \textbf{x}^{\rm T}\textbf{b}$

该函数一、二阶导为:

$\textbf{A}\textbf{x} - \textbf{b}，$

$D^2f(x) = \textbf{A},$

由于 $\textbf{A}$ 对称且正定， $f (x)$ 有唯一最小值。取 $\textbf{P}_{0}$ 为 $f (x)$ 在 $\textbf{x}_{0}$ 处的负梯度，即 $\textbf{P}_{0} = \textbf{b} - \textbf{Ax}_{0}$ ， $\textbf{P}_{0}$ 同时也是算法初始步骤的残差项。
令 $\textbf{r}_{k}$ 为第 $k$ 步的残差：
$\textbf{r}_{k} = \textbf{b} - \textbf{Ax}_{k}$

$\textbf{r}_{k}$ 也是梯度下降法中的下降方向，在共轭梯度法中，为保证当前下降方向与之前步骤中的下降方向共轭，取：
$\textbf{P}_{k} = \textbf{r}_{k} - \sum\limits_{i<k}{}\frac{\textbf{P}_{i}^{\rm T}\textbf{A}\textbf{r}_{k}}{\textbf{P}_{i}^{\rm T}\textbf{A}\textbf{P}_{i}}\textbf{P}_{i}$

沿着这个方向，更新后的 $\textbf{x}$ 值为：
$\textbf{x}_{k+1} = \textbf{x}_{k} + \alpha_{k}\textbf{P}_{k}$

其中
$\alpha_k = \frac{\textbf{P}_k^{\rm T}\left(\textbf{b} - \textbf{Ax}_{k}\right)}{\textbf{P}_k^{\rm T}\textbf{A}\textbf{P}_k} = \frac{\textbf{P}_k^{\rm T}\textbf{r}_k}{\textbf{P}_k^{\rm T}\textbf{A}\textbf{P}_k}$

$\alpha_{k}$ 通过最小化下式得到，
$f(\textbf{x}_{k+1}) = f(\textbf{x}_{k} + \alpha_{k}\textbf{P}_{k}) =: g(\alpha_{k})$
令其对 $\alpha_k$ 的导数为0。
$g'(\alpha_{k})\stackrel{!}{=}0\quad\Leftrightarrow\quad \alpha_{k} = \frac{\textbf{P}_{k}^{\rm T}(\textbf{b} - \textbf{Ax}_{k})}{\textbf{P}_{k}^{\rm T}\textbf{AP}_{k}}$

共轭梯度法流程

$\textbf{r}_{0} := \textbf{b} - \textbf{Ax}_{0}$
$\textbf{P}_0 := \textbf{r}_0$
$k : = 0$
repeat
$\alpha_{k} := \frac{\textbf{r}_k^{\rm T}\textbf{r}_k}{\textbf{P}_{k}^{\rm T}\textbf{AP}_{k}}$
$\textbf{x}_{k+1} := \textbf{x}_{k} + \alpha_{k}\textbf{P}_{k}$
$\textbf{r}_{k+1} := \textbf{r}_k - \alpha_k\textbf{A}\textbf{P}_k$
if $\textbf{r}_{k+1}$ is suffiently small ,then exit loop.
$\beta_k := \frac{\textbf{r}_{k+1}^{\rm T}\textbf{r}_{k+1}}{\textbf{r}_k^{\rm T}\textbf{r}_k}$
$\textbf{P}_{k+1} := \textbf{r}_{k+1} + \beta_k\textbf{P}_{k}$
$k : = k + 1$
end repeat

共轭梯度法代码

function [x] = conjgrad(A, b, x)
    r = b - A * x;
    p = r;
    rsold = r' * r;

    for i = 1:length(b)
        Ap = A * p;
        alpha = rsold / (p' * Ap);
        x = x + alpha * p;
        r = r - alpha * Ap;
        rsnew = r' * r;
        if sqrt(rsnew) < 1e-10
              break;
        end
        p = r + (rsnew / rsold) * p;
        rsold = rsnew;
    end
end

没写完，待续、