n元(维)正态分布(The multivariate normal distribution)

  在学习高斯判别分析(Gaussian discriminant analysis)时,出现了n元正态分布的密度函数,函数中出现了矩阵,弄得大家一头雾水。其实这个公式在大部分概率论书籍中都没有提到,不过,简要推导一下,就可以得到结果。

  茆诗松《概率论与数理统计教程》第二版中介绍了协方差矩阵和n元正态分布的密度函数,截图大家看一下,推荐身边准备这本书!
这里写图片描述
这里写图片描述如上图所示,下面简要推导一下公式:
一元正态分布
这里写图片描述

二元正态分布
这里写图片描述

公式中,有一个相关系数(读作rou,符号形状和p相似,为了便于书写,后文就用p来表示)。二元正态分布满足下面两个性质(推广到n元正态分布也有类型的性质):

  • 二元正态分布的边缘分布(边际分布)为一元正态分布,且二元正态分布的边际分布中不含参数p
  • 二元正态分布中除含有各分量的边际分布外,还含有两个分量间相互关联的信息。描述这种相互关联程度的一个特征数就是协方差。

从上面两条信息可得,已知n元联合正态分布,推导其变量的边际分布很容易;已

### 一正态分布与二正态分布的数学定义、特性及区别 #### 1. 数学定义 一正态分布是一种连续型概率分布,其概率密度函数由均值 \( \mu \) 和标准差 \( \sigma \) 定义。它的表达式如下: \[ f(x|\mu,\sigma^2)=\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}} \] 其中,\( \mu \) 表示随机变量的期望值,而 \( \sigma \) 则代表该分布的标准差[^1]。 对于二正态分布而言,则涉及两个随机变量 \( X \) 和 \( Y \),它们共同构成一个二随机向量 \( Z=(X,Y)^T \)。此分布通过均值向量 \( \boldsymbol{\mu}=[\mu_X, \mu_Y]^T \) 及协方差矩阵 \( \Sigma=\begin{bmatrix} \sigma_{XX}&\sigma_{XY}\\ \sigma_{YX}&\sigma_{YY} \end{bmatrix} \) 描述。具体形式为: \[ f(x,y| \boldsymbol{\mu}, \Sigma)=(2\pi)|\Sigma|^{1/2}exp[-\frac{1}{2}(Z-\boldsymbol{\mu})^T\Sigma^{-1}(Z-\boldsymbol{\mu})] \] 这里需要注意的是,协方差矩阵中的素不仅包含了各自变量自身的方差 (\( \sigma_{XX} \), \( \sigma_{YY} \)) ,还反映了两者的相互关系——即协方差项 \( \sigma_{XY}=Cov(X,Y) \)[^2]。 #### 2. 特性对比分析 - **度差异** - 一正态分布在单轴上描述了一个单独随机变量的行为模式;它仅需考虑单一方向上的变化趋势及其集中程度。 - 而二正态分布则扩展到了平面空间内,能够同时刻画两个关联随机变量间的互动规律。这使得它可以更全面地反映实际现象中存在的复杂依赖结构[^3]。 - **参数体系的不同** - 对于前者来说,只需设定好位置参数(平均数)和尺度参数(标准偏差),即可完全确定整个模型形态; - 后者除了上述两项外还需额外引入交叉影响因子ρ来衡量两者间线性联系强度大小,并以此为基础构建完整的协方差阵列作为整体框架支撑点之一[^4]。 - **图形表现形式的区别** - 当我们观察到一条钟形曲线时,那很可能是某个特定条件下的一高斯分布实例化后的可视化成果展示画面呈现给我们看的样子而已啦!因为这种形状正好对应着理想状态下最可能出现的结果区域轮廓特征嘛~ - 如果把目光转向更高层次的空间领域里去探索的话就会发现原来还有另外一种更加丰富多彩而又充满魅力的存在方式等着被发掘出来呢~那就是所谓的双变量联合概率密度图像哦! 这种类型的图表通常会采用三表面或者等高线条的形式来进行描绘渲染操作从而达到直观易懂的效果目的哟! ```python import numpy as np from scipy.stats import multivariate_normal import matplotlib.pyplot as plt from mpl_toolkits.mplot3d import Axes3D # Define parameters for the distribution. mu_x = 0 mu_y = 0 variance_x = 1 variance_y = 1 # Create grid and multivariate normal x = np.linspace(-3,3,500) y = np.linspace(-3,3,500) X, Y = np.meshgrid(x,y) pos = np.empty(X.shape + (2,)) pos[:, :, 0] = X; pos[:, :, 1] = Y rv = multivariate_normal([mu_x, mu_y], [[variance_x, .5*variance_x * variance_y],[.5*variance_x * variance_y,variance_y]]) # Make a 3D plot fig = plt.figure() ax = fig.gca(projection='3d') ax.plot_surface(X, Y, rv.pdf(pos),cmap='viridis',linewidth=0) ax.set_xlabel('X axis') ax.set_ylabel('Y axis') ax.set_zlabel('Probability Density') plt.show() ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值