原创作品,允许转载,转载时请务必以超链接形式标明文章
这里
这里
称为从
到
的马氏距离(Mahalanobis distance),当
是单位矩阵时变为欧氏距离(Euclidean distance)。因为该二次项为常数,所以在X-空间表面高斯分布也是常量。
首先,我们注意到
是一个对称矩阵,不失一般性,任何非对称部分将从指数中消失。现在来考虑协方差矩阵的特征向量等式
这里
这里
是单位矩阵的第i行的第j个元素,满足
这里我们定义
我们可以将
理解为由正交向量
定义的新的坐标系,该坐标系是对初始
坐标的平移和旋转。用向量
的形式,我们有![]()
这里
是一个行向量为
的矩阵。从(2.46)了解到
是正交矩阵,比如它满足
也满足
(
是单位矩阵)。
定义的新坐标系下的高斯分布形式。从X到Y坐标系,我们有一雅克比矩阵
(Jacobian matrix),它的元素定义为

是
的元素。用
地正交性质,可见雅克比矩阵(Jacobian matrix)行列式的平方是
![]()
即是D个独立单变量高斯分布的乘积。因此,特征向量定义新的旋转和平移坐标系时考虑到了将联合概率分布分解成独立分布的乘积。在
坐标系下,分布的积分为

这里我们使用了(2.48)的结果来标准化单变量高斯分布。该式证实了多变量高斯(2.43)确实是正态的。
这里我们使用了变量替换
。注意到指数是因子Z的偶函数,并且积分区域是(- ∞,+ ∞),因此,
中的
将会对称抵消。因此,
是高斯二阶矩。而对于多变量高斯,存在
个二阶矩由
表示,可以组合形成矩阵
。该矩阵可记为
这里我们仍然采用了变量替换
。注意到交叉项
和
会再次被对称抵消。
项是常量(是一个单元(unity),因为高斯分布的标准化),可提到积分号外边。考虑
项,我们可以再次使用(2.45)给出的协方差矩阵的特征向量展开,并结合特征向量集的完备性,记
这里我们使用了特征向量等式(2.45),并结合了中间行的右边积分除非i=j将会消失,在最后一行,我们使用了(1.50)、(2.55)和(2.48)的结果。因此,我们有![]()
对于特定的高斯分布,我们可以使用
本文详细介绍了高斯分布的定义、性质、几何形式、矩的计算以及在实际应用中的重要性。高斯分布作为统计学中最常用的分布之一,不仅在理论上有其独特的性质,如熵最大性质和中心极限定理的应用,还在多个领域如图像处理、AI音视频处理、机器学习中发挥关键作用。文中还解释了高斯分布的几何形式如何通过马氏距离和特征向量展开来直观展示分布的形状和方向性,以及如何通过坐标变换简化分析过程。此外,通过计算高斯分布的期望和二阶矩,进一步展示了高斯分布参数的意义和计算方法。最后,讨论了高斯分布的局限性及其在混合高斯分布、潜在变量模型中的应用,展示了高斯分布在复杂数据建模和分析中的灵活性与局限性。







3966

被折叠的 条评论
为什么被折叠?



