联合分布

最新推荐文章于 2025-01-30 18:11:53 发布

原创最新推荐文章于 2025-01-30 18:11:53 发布 · 1w 阅读

10 ·

CC 4.0 BY-SA版权

概率论专栏收录该内容

1 篇文章

订阅专栏

让我们先从离散变量开始探讨联合概率分布。

首先，我们给定一个如下的样本空间：

Ω={hhh,hht,hth,thh,htt,tht,tth,ttt}

用这个样本空间代表连续三次投硬币可能产生的结果，h为正面，t为反面。

在概率论中，一个重要的思想是认为随机变量是从样本空间到实数的映射。比如，针对上述样本空间，我们可以建立两个随机变量：

X:投掷为正面的总数，可以取值0，1，2，3。

Y：最后一次出现负面的总数，可以取值0，1。

考虑下面的问题：如果样本空间Ω中每个结果出现的概率相等。而样本空间中共有8个结果，那么每个结果的出现的概率都是1/8。在这样的条件下，X=0，Y=1同时出现的概率是多少呢？按照我以前的知识，我可能第一反应是用两个独立随机变量同时出现的概率计算方法来解决这个问题。然而，不幸的是，这并不是两个独立的随机变量，X的不同取值会影响到Y的取值。在上述的例子中，P(X=0,Y=1)=P({ttt})=1/8，这是非独立变量X,Y同时发生X=0，Y=1的概率，即联合概率。对于所有的X取值和Y取值的组合，我们都可以计算这样一个联合概率，这个联合概率的集合将构成一个联合分布。针对上述的例子，我们可以列出一个联合分的表

连续随机变量的联合分布同此一理。不同的是，对于连续随机变量来说，通过概率密度函数计算概率的方式稍微复杂一些。学过正态分布的同学，应该知道，对于正态分布函数来说，如果要计算区间[a,b]的概率，我们要计算a至b这段函数的面积。通过积分即可求解。对于连续变量的联合分布来讲，由于它是关于两个随机变量共同出现的描述，所以它的概率密度函数将呈现在一个三维空间中。

在这个空间中，x轴，y轴分别代表两个随机变量，z轴的值是概率密度函数。如果我们希望求得变量x在区间[a,b]，变量y在区间[c,d]的概率，now, use your imagination我们要首先在xoy平面上画出位于两个区间内的平行四边形，而后以这个平行四边形为底沿z轴方向切割空间至概率密度函数终止。这样将得到一个立方体，其体积即是所欲求得的概率值。同样，可以用积分的方法来计算：

最后补充一下联合概率与条件概率的关系。

回到最开始的硬币例子。P(X=0,Y=1)=P({ttt})=1/8表示无正面出现，最后一次是背面的概率为1/8。如果我们要计算条件概率，如无正面出现时，最后一次是背面的概率，我们很清楚这概率为1。而单纯无正面出现的概率为1/8，从数字上你可以看到一些关系。实际上联合分布P(X,Y)正是可以看作是X单独出现的概率乘以X出现时Y出现的概率，即P(X,Y)=P(X)*P(Y|X)。