高斯分布归一化、期望、二阶矩、方差推导证明

这篇博客详细介绍了高斯分布的归一化、期望和方差的推导过程。作者在研究深度学习时意识到微积分的重要性,并尝试自己推导高斯分布的数学性质。归一化通过极坐标转换得以证明,期望的求解相对直接,而二阶矩的推导涉及Gamma函数。方差的计算则利用一阶矩和二阶矩。博客最后提到,作者计划完成更全面的公式推导笔记。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

目录

写在前面的唠叨:

归一化推导证明:

期望(一阶矩)推导证明:

二阶矩推导证明:

方差推导证明:


写在前面的唠叨:

最近这段时间一直在研究深度学习之类的东西,虽然如今对几种常见的神经网络都有了很好的了解,用起来也比较顺手,但是越学也越觉得瓶颈越来越明显了,最大的问题觉得还是数学基础不行,学习那些常见的模型已经把线性代数的知识捡的差不多了,而到了想自己设计模型的时候,才忽然发现微积分也是十分重要的,而这两年我都还给老师了呀T_T。所以把PRML这本书又翻了出来,推导一下里面的公式。

然而刚看到高斯分布里面的方差推导就抽了我一嘴巴,去网上查了查发现这部分推导大家写的都挺乱的,于是自己总结了一下,留作记录,省的以后在看的时候到处乱查,重新推……


归一化推导证明:

证明归一化,即证明:

$$ \begin{aligned} \int_{-\infty }^{+\infty}N(x|\mu, \sigma^2)dx &=1 \end{aligned} $$

首先我们将其展开:

$$ \begin{aligned} \int_{-\infty }^{+\infty}N(x|\mu, \sigma^2)dx &=& \int_{-\infty }^{+\infty}\tfrac{1}{\sqrt{2\pi}\sigma }exp\{-\tfrac{1}{2\sigma^2}(x-\mu)^2\}dx \\ &=& \tfrac{1}{\sqrt{2\pi}\sigma }\int_{-\infty }^{+\infty}exp\{-\tfrac{1}{2\sigma^2}(x-\mu)^2\}dx \end{aligned} $$

这里将 x-\mu替换掉有:

\int_{-\infty }^{+\infty}N(x|\mu, \sigma^2)dx = \tfrac{1}{\sqrt{2\pi}\sigma }\int_{-\infty }^{+\infty}exp\{-\tfrac{1}{2\sigma^2}x^2\}dx

这里假设:

$$ \begin{aligned} I &= \int_{-\infty }^{+\infty}exp\{-\tfrac{1}{2\sigma^2}x^2\}dx \end{aligned} $$

这个积分直接计算比较困难,但是可以绕个弯,采用极坐标的方式计算,首先我们将其求其平方:

$$ \begin{aligned} I^2 & = \int_{-\infty }^{+\infty}\int_{-\infty }^{+\infty}exp\{-\tfrac{1}{2\sigma^2}(x^2 + y^2)\}dxdy \end{aligned} $$

在将其转化为极坐标,令x = cos\theta r ,\ y = sin\theta r可得:

$$ \begin{aligned} I^2 & = \int_{0 }^{2\pi}\int_{0 }^{+\infty}exp\{-\tfrac{r^2}{2\sigma^2}\}rdrd\theta \\ &= \pi \int_{0}^{+\infty}exp\{-\tfrac{r^2}{2\sigma^2}\}dr^2 \\ &= 2 \pi \sigma^2 \end{aligned} $$

即:

$$ \begin{aligned} \int_{-\infty }^{+\infty}N(x|\mu, \sigma^2)dx &=\tfrac{1}{\sqrt{2\pi}\sigma } I \\ & = 1 \end{aligned} $$

恩!大功告成!


期望(一阶矩)推导证明:

证明期望就比较简单了~

$$ \begin{aligned}E(X) & = \int_{-\infty }^{+\infty}xN(x|\mu, \sigma^2)dx \\ &= \int_{-\infty }^{+\infty}x\tfrac{1}{\sqrt{2\pi}\sigma }exp\{-\tfrac{1}{2\sigma^2}(x-\mu)^2\}dx \end{aligned} $$

将 x-\mu替换掉有:

$$ \begin{aligned}E(X) &= \int_{-\infty }^{+\infty}(x+\mu)\tfrac{1}{\sqrt{2\pi}\sigma }exp\{-\tfrac{1}{2\sigma^2}x^2\}dx \\ &= \int_{-\infty }^{+\infty}x\tfrac{1}{\sqrt{2\pi}\sigma }exp\{-\tfrac{1}{2\sigma^2}x^2\}dx + \int_{-\infty }^{+\infty}\mu\tfrac{1}{\sqrt{2\pi}\sigma }exp\{-\tfrac{1}{2\sigma^2}x^2\}dx \\ \end{aligned} $$

这里\int_{-\infty }^{+\infty}x\tfrac{1}{\sqrt{2\pi}\sigma }exp\{-\tfrac{1}{2\sigma^2}x^2\}dx为奇函数,所以该项积分为0,所以:

$$ \begin{aligned}E(X) &= \int_{-\infty }^{+\infty}\mu\tfrac{1}{\sqrt{2\pi}\sigma }exp\{-\tfrac{1}{2\sigma^2}x^2\}dx \\ &= \mu \int_{-\infty }^{+\infty}\tfrac{1}{\sqrt{2\pi}\sigma }exp\{-\tfrac{1}{2\sigma^2}x^2\}dx \\ &= \mu \int_{-\infty }^{+\infty}N(x|0, \sigma^2)dx \\ &= \mu\end{aligned} $$


二阶矩推导证明:

就是这个东西,推了一上午都没推出来,最后还是的问了周围考研的同学,真是耻辱,被挂起来抽。这里给出了两种推导方式:

1. 展开利用Gamma函数进行求解:

$$ \begin{aligned}E(X^2) & = \int_{-\infty }^{+\infty}x^2N(x|\mu, \sigma^2)dx \\ &= \int_{-\infty }^{+\infty}x^2\tfrac{1}{\sqrt{2\pi}\sigma }exp\{-\tfrac{1}{2\sigma^2}(x-\mu)^2\}dx \\ \end{aligned}$$

将 x-\mu替换掉有:

$$ \begin{aligned}E(X^2) & = \int_{-\infty }^{+\infty}(x+\mu)^2\tfrac{1}{\sqrt{2\pi}\sigma }exp\{-\tfrac{1}{2\sigma^2}x^2\}dx \\ &= \int_{-\infty }^{+\infty}x^2\tfrac{1}{\sqrt{2\pi}\sigma }exp\{-\tfrac{1}{2\sigma^2}x^2\}dx + \int_{-\infty }^{+\infty}2x\mu\tfrac{1}{\sqrt{2\pi}\sigma }exp\{-\tfrac{1}{2\sigma^2}x^2\}dx + \int_{-\infty }^{+\infty}\mu^2\tfrac{1}{\sqrt{2\pi}\sigma }exp\{-\tfrac{1}{2\sigma^2}x^2\}dx \\ &= \int_{-\infty }^{+\infty}x^2\tfrac{1}{\sqrt{2\pi}\sigma }exp\{-\tfrac{1}{2\sigma^2}x^2\}dx + 0 + \mu^2 \\ &=\tfrac{4\sigma}{\sqrt{2\pi} }\int_{0 }^{+\infty}\tfrac{x^2}{2\sigma^2 }exp\{-\tfrac{1}{2\sigma^2}x^2\}dx + \mu^2 \end{aligned}$$

这里令第一项中\tfrac{x^2}{2\sigma^2 } = t,即有:

$$ \begin{aligned}E(X^2) & = \tfrac{2\sigma^2}{\sqrt{\pi} }\int_{0 }^{+\infty}\sqrt{t}e^{-t}dx + \mu^2 \\ &= \tfrac{2\sigma^2}{\sqrt{\pi} }\Gamma ( \tfrac{3}{2}) + \mu^2 \\ &= \tfrac{2\sigma^2}{\sqrt{\pi} } \tfrac{\sqrt{\pi}}{2 } + \mu^2 \\ &= \sigma^2 + \mu^2 \end{aligned}$$

这里用到了\Gamma()函数,也就是我们通常说的伽马函数,它的定义是这样的:

\Gamma(z) = \int_{0 }^{+\infty}\frac{t^{z-1}}{e^t}dt

这里有几个特殊值,感兴趣的话可以记一下。

\begin{array}{rcccl} \Gamma\left(-\tfrac{3}{2}\right) &=& \tfrac{4}{3} \sqrt{\pi} &\approx& 2.363\,271\,801\,207 \\ \Gamma\left(-\tfrac{1}{2}\right) &=& -2\sqrt{\pi} &\approx& -3.544\,907\,701\,811 \\ \Gamma\left(\tfrac{1}{2}\right) &=& \sqrt{\pi} &\approx& 1.772\,453\,850\,906 \\ \Gamma(1) &=& 0! &=& 1 \\ \Gamma\left(\tfrac{3}{2}\right) &=& \tfrac{1}{2}\sqrt{\pi} &\approx& 0.886\,226\,925\,453 \\ \Gamma(2) &=& 1! &=& 1 \\ \Gamma\left(\tfrac{5}{2}\right) &=& \tfrac{3}{4}\sqrt{\pi} &\approx& 1.329\,340\,388\,179 \\ \Gamma(3) &=& 2! &=& 2 \\ \Gamma\left(\tfrac{7}{2}\right) &=& \tfrac{15}{8}\sqrt{\pi} &\approx& 3.323\,350\,970\,448 \\ \Gamma(4) &=& 3! &=& 6 \end{array}

特殊值内容来自中文wiki,所以出错了不负责哦,嘿嘿……

当然这里用到了伽马函数,也可以采用不用伽马函数的方法。

2. 直接积分求解:

啊~这个就是我同学的方法,实名感谢猛某,如果多年后您看见这篇博客别忘了朝我要稿费。

$$ \begin{aligned}E(X^2) & = \int_{-\infty }^{+\infty}x^2N(x|\mu, \sigma^2)dx \\ &= \int_{-\infty }^{+\infty}x^2\tfrac{1}{\sqrt{2\pi}\sigma }exp\{-\tfrac{1}{2\sigma^2}(x-\mu)^2\}dx \\ &= \int_{-\infty }^{+\infty}\tfrac{(x-\mu)(x+\mu) +\mu^2}{\sqrt{2\pi}\sigma }exp\{-\tfrac{1}{2\sigma^2}(x-\mu)^2\}dx \\ &= \int_{-\infty }^{+\infty}\tfrac{(x-\mu)(x+\mu)}{\sqrt{2\pi}\sigma }exp\{-\tfrac{1}{2\sigma^2}(x-\mu)^2\}dx + \mu^2\int_{-\infty }^{+\infty}\tfrac{ 1}{\sqrt{2\pi}\sigma }exp\{-\tfrac{1}{2\sigma^2}(x-\mu)^2\}dx \\ &= \int_{-\infty }^{+\infty}-\tfrac{(x+\mu)\sigma}{\sqrt{2\pi} }dexp\{-\tfrac{1}{2\sigma^2}(x-\mu)^2\} + \mu^2 \\ &= -\tfrac{(x+\mu)\sigma}{\sqrt{2\pi} }exp\{-\tfrac{1}{2\sigma^2}(x-\mu)^2\}|^{+\infty}_{-\infty} + \int_{-\infty }^{+\infty}\tfrac{\sigma}{\sqrt{2\pi} }exp\{-\tfrac{1}{2\sigma^2}(x-\mu)^2\}dx + \mu^2 \\ &= 0 + \sigma^2\int_{-\infty }^{+\infty}\tfrac{1}{\sqrt{2\pi}\sigma }exp\{-\tfrac{1}{2\sigma^2}(x-\mu)^2\}dx + \mu^2 \\ &= \sigma^2 + \mu^2 \end{aligned}$$


方差推导证明:

既然我们已经求的了一阶矩、二阶矩,那么再求方差就简单了:

$$ \begin{aligned}D(X) & = E(X^2) - E(X)^2 \\ &= \sigma^2 + \mu^2 - \mu^2\\ &= \sigma^2 \end{aligned}$$

当然方差也可以直接求,因为这部分已经有前辈推导过了,我就直接上图了!(才不是嫌麻烦,不想写latex代码

这里标明出处,前辈的推导很棒,给了我很大帮助。


留个坑:

本来是想写个PRML的全公式推导的读书笔记,然而码完了这些代码,突然觉得好麻烦收获好大,尽力吧,如果时间充裕会补一补,留个坑,溜……

### 高斯分布推导过程与数学原理 高斯分布(正态分布)是概率论和统计学中最重要的分布之一。其推导过程涉及多个数学概念,包括最大熵原则、中心极限定理以及概率密度函数的性质。 #### 1. 最大熵原则 高斯分布的一个重要特性是它是在给定均值和方差的情况下,使熵最大化的一种分布[^1]。熵是衡量随机变量不确定性的指标。对于一个连续随机变量 \( X \),其熵定义为: \[ H(X) = -\int_{-\infty}^{\infty} f(x) \log f(x) dx \] 在约束条件 \( E(X) = \mu \) 和 \( Var(X) = \sigma^2 \) 下,高斯分布是唯一能使熵最大的分布。 #### 2. 中心极限定理 中心极限定理表明,当样本数量足够大时,独立同分布的随机变量之和趋于正态分布[^4]。具体来说,如果 \( X_1, X_2, \ldots, X_n \) 是独立同分布的随机变量,且具有有限的均值 \( \mu \) 和方差 \( \sigma^2 \),则随机变量 \( Z = \frac{\sum_{i=1}^{n} X_i - n\mu}{\sqrt{n}\sigma} \) 的分布将趋近于标准正态分布 \( N(0, 1) \)。 #### 3. 概率密度函数的推导 高斯分布的概率密度函数为: \[ f_X(x) = \frac{1}{\sigma \sqrt{2\pi}} \exp\left(-\frac{(x-\mu)^2}{2\sigma^2}\right) \] 其中,\( \mu \) 为均值,\( \sigma^2 \) 为方差。该函数可以通过以下步骤推导: - **标准化**:令 \( y = x - \mu \),则 \( y \) 的分布变为零均值分布。 - **积分计算**:根据期望的定义,可以得到 \( E(X) = \mu \)[^3]。具体地,通过奇函数的对称性,证明了第一部分积分 \( I_1 = 0 \)。 - **归一化常数**:为了保证概率密度函数在整个实数范围上的积分为 1,引入归一化因子 \( \frac{1}{\sigma \sqrt{2\pi}} \)。 #### 4. 数学性质 高斯分布具有以下重要性质: - 对称性:以均值 \( \mu \) 为中心对称。 - 独立性:若两个随机变量 \( X \) 和 \( Y \) 均服从高斯分布,则它们的线性组合也服从高斯分布[^5]。 - 边际分布:高斯过程中的边际分布仍然是高斯分布[^2]。 ```python import numpy as np import matplotlib.pyplot as plt # 定义高斯分布的概率密度函数 def gaussian_pdf(x, mu=0, sigma=1): return (1 / (sigma * np.sqrt(2 * np.pi))) * np.exp(-((x - mu)**2) / (2 * sigma**2)) # 绘制高斯分布曲线 x = np.linspace(-5, 5, 1000) y = gaussian_pdf(x) plt.plot(x, y, label='Gaussian Distribution') plt.title('Gaussian Distribution Curve') plt.xlabel('x') plt.ylabel('Probability Density') plt.legend() plt.show() ```
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值