两个高斯分布相加(卷积)的理论推导

本文深入探讨并推导了两个高斯分布相加的结果,揭示了正态分布随机变量和的数学特性,通过卷积概念解析了独立高斯变量相加后的分布规律。

本文主要推导两个高斯分布的相加结果。在知乎上有个问题:正态分布随机变量的和还是正态分布吗? _ 也是本文主要解决的问题。

高斯分布的概率密度函数:
f ( x ) = 1 2 π δ e − ( x − u ) 2 2 δ 2 (1) f(x) = \frac{1}{\sqrt{2\pi}\delta}{e^{-\frac{(x-u)^2}{2\delta^2}}} \tag{1} f(x)=2π δ1e2δ2(xu)2(1)

直觉中,两个高斯(正态)随机变量的和似乎应该是两个概率密度函数的和,如下图所示,其结果就近似为两个概率密度的包络线,这明显是错误的,是用直觉推导数学,大错特错
在这里插入图片描述
在解决此问题前,我们需要搞清楚两个高斯函数的和的物理意义,这里用经典的投骰子作为为例子更好理解。

  • 离散卷积:投骰子 - 同时投求两个骰子所的点数相加得4的概率是多少?
    则其结果为
    p 1 ( 1 ) p 2 ( 3 ) + p 1 ( 2 ) p 2 ( 2 ) + p 1 ( 3 ) p 2 ( 1 ) = 1 12 (2) p_1(1)p_2(3)+p_1(2)p_2(2)+p_1(3)p_2(1)=\frac{1}{12}\tag{2} p1(1)p2(3)+p1(2)p2(2)+p1(3)p2(1)=121(2)

注意这里的概率为 P ( X + Y = 4 ) P(X+Y=4) P(X+Y=4),因此卷积的物理意义不是两个概率密度相加,而是自变量相加后发生的概率,即若设 z = x + y z=x+y z=x+y,则有 z z z 发生的概率为:
f ( z ) = ∫ − ∞ + ∞ f ( x ) f ( z − x ) d x (3) f(z)=\int^{ +\infty }_{ - \infty }f(x)f(z-x)dx\tag{3} f(z)=+f(x)f(zx)dx(3)

当理解到这里时,我们就可以很容易的计算两个高斯分布的加和了。


两个高斯分布相加本质问题可抽象为:已知两个独立高斯分布 N 1 ∼ ( u 1 , δ 1 2 ) N_1∼(u_1, \delta_1^2) N1(u1,δ12), N 2 ∼ ( u 2 , δ 2 2 ) N_2∼(u_2, \delta_2^2) N2(u2,δ22),求新的概率分布 N = N 1 + N 2 ∼ ( ? , ? ) N =N_1+N_2∼(?,?) N=N1+N2(?,?)

N 1 N_1 N1 的概率分布函数为 f 1 ( x ) f_1(x) f1(x) N 2 N_2 N2 的概率分布函数为 f 2 ( y ) f_2(y) f2(y), 则此问题变为求 f ( z = x + y ) f(z=x+y) f(z=x+y)的概率密度函数?
f ( z ) = ∫ − ∞ + ∞ f 1 ( x ) f 2 ( z − x ) d x = ∫ − ∞ + ∞ 1 2 π δ 1 e − ( x − u 1 ) 2 2 δ 1 2 ⋅ 1 2 π δ 2 e − ( z − x − u 2 ) 2 2 δ 2 2 d x (4) \begin{aligned} f(z)&=\int^{ +\infty }_{ - \infty }f_1(x)f_2(z-x)dx\\\\ &=\int^{ +\infty }_{ - \infty }\frac{1}{\sqrt{2\pi}\delta_1}{e^{-\frac{(x-u_1)^2}{2\delta_1^2}}}\cdot\frac{1}{\sqrt{2\pi}\delta_2}{e^{-\frac{(z-x-u_2)^2}{2\delta_2^2}}}dx \end{aligned}\tag{4} f(z)=+f1(x)f2(zx)dx=+2π δ11e2δ12(xu1)22π δ21e2δ22(zxu2)2dx(4)
仔细一看,这里的 f ( z ) f(z) f(z) 就是在前一节《两个高斯分布乘积的理论推导》中推导的结果,这里先引用前一节的推导结果,公式7 和 公式8
f 1 ( x ) f 2 ( x ) = S g ⋅ 1 2 π δ e − ( x − u ) 2 2 δ 2 S g = 1 2 π ( δ 1 2 + δ 2 2 ) e − ( u 1 − u 2 ) 2 2 ( δ 1 2 + δ 2 2 ) (5) \begin{aligned} f_1(x)f_2(x) &=S_g\cdot\frac{1}{\sqrt{2\pi} \delta}{e^{-\frac{(x-u)^2}{2\delta^2}}}\\\\ S_g&=\frac{1}{\sqrt{2\pi(\delta_1^2+\delta_2^2)}}e^{-\frac{(u_1-u_2)^2}{2(\delta_1^2+\delta_2^2)}}\tag{5} \end{aligned} f1(x)f2(x)Sg=Sg2π δ1e2δ2(xu)2=2π(δ12+δ22) 1e2(δ12+δ22)(u1u2)2(5)
将公式5代入公式4,其中 f 1 ( x ) ∼ ( u 1 , δ 1 2 ) f_1(x)∼(u_1, \delta_1^2) f1(x)(u1,δ12) , f 2 ( x ) ∼ ( z − u 2 , δ 2 2 ) f_2(x)∼(z-u_2, \delta_2^2) f2(x)(zu2,δ22) 可得:
f ( z ) = ∫ − ∞ + ∞ 1 2 π δ 1 e − ( x − u 1 ) 2 2 δ 1 2 ⋅ 1 2 π δ 2 e − ( x − ( z − u 2 ) ) 2 2 δ 2 2 d x = ∫ − ∞ + ∞ S g ⋅ 1 2 π δ e − ( x − u ) 2 2 δ 2 d x = S g (6) \begin{aligned} f(z)&=\int^{ +\infty }_{ - \infty }\frac{1}{\sqrt{2\pi}\delta_1}{e^{-\frac{(x-u_1)^2}{2\delta_1^2}}}\cdot\frac{1}{\sqrt{2\pi}\delta_2}{e^{-\frac{(x-(z-u_2))^2}{2\delta_2^2}}}dx\\\\ &=\int^{ +\infty }_{ - \infty }S_g\cdot\frac{1}{\sqrt{2\pi} \delta}{e^{-\frac{(x-u)^2}{2\delta^2}}}dx\\\\ &=S_g \end{aligned}\tag{6} f(z)=+2π δ11e2δ12(xu1)22π δ21e2δ22(x(zu2))2dx=+Sg2π δ1e2δ2(xu)2dx=Sg(6)

其中:
S g = 1 2 π ( δ 1 2 + δ 2 2 ) e x p ( − ( u 1 − ( z − u 2 ) ) 2 2 ( δ 1 2 + δ 2 2 ) ) (7) S_g=\frac{1}{\sqrt{2\pi(\delta_1^2+\delta_2^2)}}exp\bigg(-\frac{(u_1-(z-u_2))^2}{2(\delta_1^2+\delta_2^2)}\bigg)\tag{7} Sg=2π(δ12+δ22) 1exp(2(δ12+δ22)(u1(zu2))2)(7)

则可得:
f ( z ) = 1 2 π ( δ 1 2 + δ 2 2 ) e x p ( − ( z − ( u 1 + u 2 ) ) 2 2 ( δ 1 2 + δ 2 2 ) ) (8) f(z)=\frac{1}{\sqrt{2\pi(\delta_1^2+\delta_2^2)}}exp\bigg(-\frac{(z-(u_1+u_2))^2}{2(\delta_1^2+\delta_2^2)}\bigg)\tag{8} f(z)=2π(δ12+δ22) 1exp(2(δ12+δ22)(z(u1+u2))2)(8)
对比高斯分布函数表达式,可以明显看出, f ( x + y ) ∼ ( u 1 + u 2 , δ 1 2 + δ 2 2 ) f(x+y)∼(u_1+u_2, \delta_1^2+\delta_2^2) f(x+y)(u1+u2,δ12+δ22)
同理可得: f ( x − y ) ∼ ( u 1 − u 2 , δ 1 2 + δ 2 2 ) f(x-y)∼(u_1-u_2, \delta_1^2+\delta_2^2) f(xy)(u1u2,δ12+δ22)

  • 这里利用两个高斯函数的乘积的推导结果,能很快得出结论。
  • 注意:当 N 2 ∼ ( 0 , δ 2 2 ) N_2∼(0, \delta_2^2) N2(0,δ22) ,换句话说就是当 f 2 ( y ) f_2(y) f2(y) 为零均值的高斯白噪声时,可以得到一个奇特的现象: f ( x + y ) = f ( x − y ) f(x+y)=f(x-y) f(x+y)=f(xy) ,即在一个独立分布上加或减一个白噪声,其为同分布。

同时,我们可以继续推导得:
若两个独立高斯分布 N 1 ∼ ( a u 1 , ( A δ 1 ) 2 ) , N 2 ∼ ( b u 2 , ( B δ 2 ) 2 ) N_1∼(au_1, (A\delta_1)^2),N_2∼(bu_2, (B\delta_2)^2) N1(au1,(Aδ1)2)N2(bu2,(Bδ2)2)
则其卷积和为 N 1 ∼ ( u , δ 2 ) N_1∼(u, \delta^2) N1(u,δ2)

  • u = a u 1 + b u 2 u=au_1+bu_2 u=au1+bu2
  • δ 2 = A 2 δ 1 2 + B 2 δ 2 2 \delta^2= A^2\delta_1^2+B^2\delta_2^2 δ2=A2δ12+B2δ22

在这里插入图片描述

参考文献:

https://blog.youkuaiyun.com/chaosir1991/article/details/106910668
https://www.zhihu.com/question/26055805
https://blog.youkuaiyun.com/erzhonghou0033/article/details/106639102/

<think>我们之前已经讨论了两个独立样本均值之差的抽样分布服从正态分布的原因,主要是基于中心极限定理和正态分布的线性组合性质。现在用户进一步询问:“我想理解两个抽样分布满足独立样本的线性组合性质的原因”。因此,我们需要重点解释为什么独立的正态分布的线性组合仍然是正态分布,以及为什么样本均值的线性组合(在独立条件下)会保持这种性质。 关键点: 1. 独立性的作用:独立性保证了两个样本均值之间没有相关性,因此它们的协方差为零,从而方差具有可加性。 2. 正态分布的线性不变性:正态分布的一个关键性质是,任意线性组合(只要系数不全为零)仍然服从正态分布。 3. 样本均值的正态性:当总体是正态分布时,样本均值精确服从正态分布;当总体非正态但样本量足够大时,样本均值近似服从正态分布(由中心极限定理)。 因此,回答将围绕这些点展开,特别是从独立性和正态分布的性质角度进行解释。 注意:用户引用了四篇参考文献,其中[1],[3],[4]都提到了正态总体的抽样分布性质,[2]解释了独立同分布的概念。我们在回答中可以适当引用这些内容。 回答结构: 1. 重新强调独立性的重要性及其对线性组合的影响。 2. 解释正态分布的线性组合性质。 3. 结合样本均值的分布,说明为什么独立样本均值之差服从正态分布。 4. 补充说明非正态总体下的近似情况(由中心极限定理)。 数学推导: 设$\overline{X}_1 \sim N(\mu_1, \sigma_1^2/n_1)$,$\overline{X}_2 \sim N(\mu_2, \sigma_2^2/n_2)$,且两者独立。 令$Y = a\overline{X}_1 + b\overline{X}_2$,其中$a=1, b=-1$。 则$Y$的均值为$a\mu_1+b\mu_2$,方差为$a^2(\sigma_1^2/n_1)+b^2(\sigma_2^2/n_2)$(由独立性)。 由于$\overline{X}_1$和$\overline{X}_2$都是正态分布,且独立,所以它们的线性组合$Y$也是正态分布。 原因在于:两个独立正态随机变量的线性组合仍然是正态随机变量。这是一个经典的性质,可以通过特征函数或卷积公式证明。 因此,我们得到$\overline{X}_1 - \overline{X}_2 \sim N(\mu_1-\mu_2, \frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2})$。 注意:如果两个样本不独立,那么方差计算需要加上协方差项,且分布可能不是正态分布。 现在,我们按照要求用中文回答,并注意数学格式。 </think>### 两个抽样分布满足独立样本的线性组合性质的原因 当两个抽样分布满足独立性和正态性时,其线性组合(如均值之差)仍服从正态分布,核心原因如下: #### 1. **独立性的关键作用** [^2] - **独立性**保证了两个样本的统计量互不影响: $$ \text{Cov}(\overline{X}_1, \overline{X}_2) = 0 $$ - 这使得线性组合的方差可直接相加: $$ \text{Var}(a\overline{X}_1 + b\overline{X}_2) = a^2\text{Var}(\overline{X}_1) + b^2\text{Var}(\overline{X}_2) $$ 例如在均值差 ($a=1, b=-1$) 时: $$ \text{Var}(\overline{X}_1 - \overline{X}_2) = \frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2} $$ #### 2. **正态分布的线性不变性** [^1][^4] 若随机变量 $X \sim N(\mu_x, \sigma_x^2)$ 和 $Y \sim N(\mu_y, \sigma_y^2)$ 相互独立,则对任意常数 $a,b$: $$ aX + bY \sim N(a\mu_x + b\mu_y, a^2\sigma_x^2 + b^2\sigma_y^2) $$ **证明**: - 正态分布的特征函数为 $\phi(t) = e^{i\mu t - \frac{1}{2}\sigma^2 t^2}$ - 独立变量的线性组合特征函数满足: $$ \phi_{aX+bY}(t) = \phi_X(at) \cdot \phi_Y(bt) $$ - 代入后仍为正态特征函数形式。 #### 3. **样本均值分布的正态性基础** [^1][^3] - 当总体服从正态分布 $N(\mu, \sigma^2)$ 时,样本均值精确服从正态分布: $$ \overline{X} \sim N\left(\mu, \frac{\sigma^2}{n}\right) $$ - 对于两个独立样本: $$ \overline{X}_1 \sim N\left(\mu_1, \frac{\sigma_1^2}{n_1}\right), \quad \overline{X}_2 \sim N\left(\mu_2, \frac{\sigma_2^2}{n_2}\right) $$ - 代入线性不变性公式即得: $$ \overline{X}_1 - \overline{X}_2 \sim N\left( \mu_1 - \mu_2, \frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2} \right) $$ #### 4. **非正态总体的近似情形** 若总体非正态但样本量充分大 ($n_1 \geq 30, n_2 \geq 30$),由中心极限定理: - $\overline{X}_1$ 和 $\overline{X}_2$ 分别近似正态分布 - 独立性保证其线性组合仍近似正态分布 [^1] > ⚠️ **独立性是核心前提**:若样本不独立(如配对样本),方差公式需引入协方差项: > $$ \text{Var}(\overline{X}_1 - \overline{X}_2) = \frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2} - 2\text{Cov}(\overline{X}_1, \overline{X}_2) $$ > 此时分布形态可能偏离正态 [^2]。 --- ### 直观理解 1. **正态分布的叠加性** 如同两个独立噪声源的叠加仍产生高斯噪声,独立正态变量的线性组合保持"钟形曲线"特征。 2. **抽样波动的可分解性** 独立样本的随机波动互不干扰,其差异的波动范围由方差加法规则精确描述(见图示): ``` |¯¯¯¯¯ Sample1波动范围 ¯¯¯¯¯| + |¯¯¯¯¯ Sample2波动范围 ¯¯¯¯¯| ``` ---
评论 11
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值