视觉惯性单目SLAM （四）-泰勒展开式

最新推荐文章于 2025-05-08 16:58:11 发布

翻译最新推荐文章于 2025-05-08 16:58:11 发布 · 7.2k 阅读

SLAM 专栏收录该内容

24 篇文章

订阅专栏

本文详细介绍了泰勒展开的基础概念，包括一元与多元标量函数的泰勒展开式，以及多元向量函数的泰勒展开，并探讨了不同阶次逼近的方法。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1. 基本要概念

泰勒多项式（Taylor polynomial）
泰勒展开式（Taylor expansion）：即泰勒多项式
泰勒公式（Taylor’s Formula）：是一个用 $\color {#00A}{函数在某点的信息}$ 描述其 $\color {#00A}{附近取值}$ 的公式
泰勒定理（Taylor’s theorem）：泰勒定理描述了一个可微函数，如果函数足够光滑的话，在已知函数在某一点的各阶导数值的情况之下，泰勒公式可以 $\color {#00A}{用这些导数值做系数}$ 构建一个多项式来 $\color {#00A}{近似函数在这一点的邻域中的值}$ ，这个多项式称为泰勒多项式（Taylor polynomial）
工

2. 一元标量函数泰勒展开式

一元标量函数：即函数只有一个自变量，且函数值为标量（实数）
$\color {red}{映射f：R^1 \to R^1}$
定义一元函数： $\color {red}{f(x)，其值为标量(实数值)}$
$f(x)在x$ 附近的值可表示为线性逼近、二次逼近、高阶逼近
$\color {#00A}{核心思想：x在指定点的邻域内，即x与指定点无限接近}$

2.1 一阶逼近（线性逼近：Linear approximation）

设 $x$ 与 $a$ 无限接近，则 $x$ 表示点 $a$ 的邻域，其线性逼近：

$f (x) \approx f (a) + f' (a) (x - a)$ $f(x) \approx f(a) + f'(a)(x-a)$
若h无际小，则 $x+h$ 表示 $x$ 邻域内的点，其线性逼近可表示为：

$f (x + h) \approx f (x) + f' (x) h$ $f(x+h) \approx f(x) + f'(x)h$

2.2 二阶逼近（二次逼近：Quadratic approximation）

比一阶更好近逼近真正的 $f(x)$
$f (x + h) \approx f (x) + f' (x) h + 1 2 f'' (x) h 2$ $f(x+h) \approx f(x) + f'(x)h + \frac {1}{2}f''(x)h^2$

2.3 高阶逼近(high-order approximation)

通用函数在点x处的多项式表式：
$f (x + h) \approx f (x) + f' (x) h + 1 2 f'' (x) h 2 + 1 6 f''' (x) h 3 + \dots$ $f(x+h) \approx f(x) + f'(x)h + \frac {1}{2}f''(x)h^2 + \frac {1}{6}f'''(x)h^3 + \cdots$
指数函数 $e^x 在x = 0$ 的附近可以用以下多项式来近似地表示：
$e x \approx 1 + x + x 2 2 + x 3 3 ! + \dots + x n n !$ $e^x \approx 1 + x + \frac{x^2}{2}+\frac{x^3}{3!} + \cdots + \frac {x^n}{n!}$

3. 多元标量函数泰勒展开式

一元标量函数：即函数只有 $\color {red}1$ 个自变量（ $\color {red}{且只有一个函数}$ ），且其值为标量
$\color {red}{映射f：R^n \to R^1}$
定义多元标量函数： $\color {red} {f(x)，其值为标量(实数值), x=(x_1, x_2, \cdots, x_n)^T \; x为列向量}$
设 $h$ 的每一维无限小，则 $x+h$ 是 $x$ 邻域内的点， $\color {red} {h=(h_1, h_2, \cdots, h_n)^T \; h为列向量}$
其前三项泰勒展开式为：
$f (x + h) \approx f (x) + (\partial f \partial x 1 (x) h 1 + \dots + \partial f \partial x n (x) h n) + 1 2 (\sum i = 1 n \partial 2 f \partial x 1 \partial x i (x) h 21 + \dots + \sum i = 1 n \partial 2 f \partial x n \partial x i (x) h 2 n)$ $f(x+h) \approx f(x) + \left(\frac {\partial f}{\partial x_1}(x) \; h_1 + \cdots + \frac {\partial f}{\partial x_n}(x) \; h_n\right) \\ +\frac{1}{2}\left( \sum_{i=1}^n \frac{\partial ^2f}{\partial x_1 \partial x_i}(x) \; h_1^2+ \cdots + \sum_{i=1}^n \frac{\partial ^2f}{\partial x_n \partial x_i}(x) \; h_n^2\right)$
矩阵表示：

∇f(x)=g=[∂f∂x1(x),∂f∂x2(x),⋯,∂f∂xn(x)](g为行向量)
- $\color {red}g$ ：为梯度( $gradient$ )，或者看作 $\color {red}{Jacobian \; Matrix}$ 的一行，因为它只有一个函数
  $H = ⎡ ⎣ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ \partial 2 f \partial x 1 \partial x 1 (x) \partial 2 f \partial x 2 \partial x 1 (x) ⋮ \partial 2 f \partial x n \partial x 1 (x) \partial 2 f \partial x 1 \partial x 2 (x) \partial 2 f \partial x 2 \partial x 2 (x) ⋮ \partial 2 f \partial x n \partial x 2 (x) \dots \dots ⋱ \dots \partial 2 f \partial x 1 \partial x n (x) \partial 2 f \partial x 2 \partial x n (x) ⋮ \partial 2 f \partial x n \partial x n (x) ⎤ ⎦ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥$ $H=\begin{bmatrix} \frac {\partial ^2f}{\partial x_1 \partial x_1}(x) & \frac {\partial ^2f}{\partial x_1 \partial x_2}(x) & \cdots & \frac {\partial ^2f}{\partial x_1 \partial x_n}(x) \\ \frac {\partial ^2f}{\partial x_2 \partial x_1}(x) & \frac {\partial ^2f}{\partial x_2 \partial x_2}(x) & \cdots & \frac {\partial ^2f}{\partial x_2 \partial x_n}(x) \\ \vdots & \vdots & \ddots & \vdots \\ \frac {\partial ^2f}{\partial x_n \partial x_1}(x) & \frac {\partial ^2f}{\partial x_n \partial x_2}(x) & \cdots & \frac {\partial ^2f}{\partial x_n \partial x_n}(x) \end{bmatrix}$
- $\color {red}H$ ：即为大家熟知的海森矩阵（ $\color {red}{Hessian \; Matrix}$ ）
- $\color {red}{f(x+h)的矩阵形式}$ ：
  $f (x + h) \approx f (x) + g h + 1 2 h T H h = f (x) + \nabla f (x) h + 1 2 h T H h$ $f(x+h) \approx f(x) + g\;h + \frac {1}{2} h^T\;H\;h \\ \quad \quad=f(x) + \nabla f(x) \;h + \frac {1}{2} h^T\;H\;h$

3. 多元向量函数泰勒展开式

$\color {red}{映射f：R^m \to R^n}$
$\color {red}函数f(x)定义$

$f (x) = ⎡ ⎣ ⎢ ⎢ ⎢ ⎢ ⎢ f 1 (x) f 2 (x) ⋮ f m (x) ⎤ ⎦ ⎥ ⎥ ⎥ ⎥ ⎥ = ⎡ ⎣ ⎢ ⎢ ⎢ ⎢ ⎢ f 1 (x 1, x 2, \dots, x n) f 2 (x 1, x 2, \dots, x n) ⋮ f m (x 1, x 2, \dots, x n) ⎤ ⎦ ⎥ ⎥ ⎥ ⎥ ⎥$ $f(x) = \begin{bmatrix} f_1(x) \\ f_2(x) \\ \vdots \\ f_m(x) \\ \end{bmatrix}=\begin{bmatrix} f_1(x_1, x_2, \cdots, x_n) \\ f_2(x_1, x_2, \cdots, x_n) \\ \vdots \\ f_m(x_1, x_2, \cdots, x_n) \\ \end{bmatrix}$
$\color {red}{Taylor展开方式}$
- $f(x)$ 的Tayloar展开：按照多元标量函数的展开方法，展开每个 $f_j(x)$
- 每个 $f_j(x)的梯度\nabla f(x)组成了一个Jacobian \; Matrix$
- 其高阶项（二阶及二阶以上）很复杂，因为每一项有一个Hessian Matrix，其结果的阶数比较高，又由于h非常小，可以忽略
$\color {red}{其前两项Taylor展开为：}$

$f (x + h) \approx f (x) + J f (x) h$ $f(x+h) \approx f(x) + J_f(x) h$
$J f (x) = J f = ⎡ ⎣ ⎢ ⎢ ⎢ ⎢ ⎢ \nabla f 1 (x) \nabla f 2 (x) ⋮ \nabla f m (x) ⎤ ⎦ ⎥ ⎥ ⎥ ⎥ ⎥ = ⎡ ⎣ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ \partial f 1 \partial x 1 \partial f 2 \partial x 1 ⋮ \partial f m \partial x 1 \partial f 1 \partial x 2 \partial f 2 \partial x 2 ⋮ \partial f m \partial x 2 \dots \dots ⋱ \dots \partial f 1 \partial x n \partial f 2 \partial x n ⋮ \partial f m \partial x n ⎤ ⎦ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥$ $J_f(x) =J_f = \begin{bmatrix} \nabla f_1(x) \\ \nabla f_2(x) \\ \vdots \\ \nabla f_m(x) \end{bmatrix}= \begin{bmatrix} \frac {\partial f_1}{\partial x_1} & \frac {\partial f_1}{\partial x_2} & \cdots & \frac {\partial f_1}{\partial x_n} \\ \frac {\partial f_2}{\partial x_1} & \frac {\partial f_2}{\partial x_2} & \cdots & \frac {\partial f_2}{\partial x_n} \\ \vdots & \vdots & \ddots & \vdots \\ \frac {\partial f_m}{\partial x_1} & \frac {\partial f_m}{\partial x_2} & \cdots & \frac {\partial f_m}{\partial x_n} \\ \end{bmatrix}$
$\color {red}{这就是多变量向量函数的局部线性化}$