边缘概率分布及其边缘化推导
与条件分布类似,主要策略是集中于联合分布的指数项的二次型,然后找出边缘分布的均值和协方差。联合分布二次型可以可以表述如下(参考条件分布博文):
为了积分xb,按照如下进行:1、考虑涉及xb的项;2、配出平方项,使得积分能够更方便的计算;选出涉及xb的项,我们有如下
其中
可以发现,与xb相关的项被转化为一个高斯分布的标准二次型,对应于
此外,与xb无关但与xa有关的项
因此,当其转化为关于xb的积分形式时
通过关于xb配出平方项的方法,可以积分出xb,余下项(与xb无关但与xa有关的项)可得如下
其中再与二次型相比较,边缘概率分布p(xa)的协方差矩阵为
均值为
类似于条件概率分布
并且根据分块矩阵的逆矩阵的恒等式
以及
进而可得
即边缘概率p(xa)的均值和协方差为
优势性总结:
-
维度的降低: 边缘概率分布允许我们从高维随机变量中提取关心的部分,使得问题的复杂性得到降低。在实际应用中,许多问题中只关心某些变量的分布,边缘化允许我们将注意力集中在重要的部分上。
-
简化问题: 通过边缘化,我们可以将原问题简化为更易处理的子问题。这在统计推断、机器学习模型的开发以及贝叶斯推理中都是常见的操作。
-
独立性的建模: 边缘概率分布允许我们对随机变量的独立性进行建模。如果两个变量在边缘分布下是独立的,那么它们的联合分布可以通过简单地将各自的边缘分布相乘得到。