多维高斯分布

最新推荐文章于 2025-02-22 16:30:00 发布

Baobin Zhang

最新推荐文章于 2025-02-22 16:30:00 发布

阅读量5.8k

点赞数 4

分类专栏：数学概念理论统计学理论

本文链接：https://blog.youkuaiyun.com/zbbmm/article/details/88246594

版权

这篇博客通过一个二维高斯分布的例子，详细介绍了从一维高斯分布到高维高斯分布的推导过程。内容包括高维高斯分布的公式来源、二维情况下的协方差矩阵计算、函数图像的对比以及参数估计方法。通过实例展示了如何从二维高斯分布的公式推导出多维高斯分布，强调了在多维情况下，高维公式如何退化为一维公式。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

我们常见的一维高斯分布公式为：

$\mathit{N(x\vert \mu, \sigma^2)} = \frac{1}{\sqrt{2\pi\sigma^2}}exp[-\frac{1}{2\sigma^2}(x-\mu)^2]$

拓展到高维就变成：

$\mathit{N(\overline{x}\vert \overline{\mu}, \Sigma)} = \frac{1}{(2\pi)^{\frac{D}{2}}}\frac{1}{|\Sigma|^{\frac{1}{2}}}exp[-\frac{1}{2}(\overline{x}-\overline{\mu})^{\mathit{T}}\Sigma^{-1}(\overline{x}-\overline{\mu})]$

其中， $\overline{x}$ 表示维度为 $\mathit{D}$ 的向量， $\overline{\mu}$ 则是这些向量的平均值， $\Sigma$ 表示所有向量 $\overline{x}$ 的协方差矩阵。

本文简单探讨一下，上面这个高维的公式是怎么来的。

二维的情况

为了简单起见，本文假设所有变量都是相互独立的。即对于概率分布函数 $f(x_0,\dots, x_n)$ 而言，有 $f(x_0, x_1, \dots, x_n) = f(x_0)f(x_1)f(x_n)$ 成立。

现在，我们用一个二维的例子推出上面的公式。

假设有很多变量 $\overline{x} = \begin{bmatrix} x_1\\x_2 \end{bmatrix}\quad$ , 他们的均值为 $\overline{\mu} = \begin{bmatrix} \mu_1\\\mu_2 \end{bmatrix}\quad$ , 方差为 $\overline{\sigma} = \begin{bmatrix} \sigma_1\\\sigma_2 \end{bmatrix}\quad$ 。