【概率论】联合分布

最新推荐文章于 2025-11-06 14:01:37 发布

原创最新推荐文章于 2025-11-06 14:01:37 发布 · 1w 阅读

5 ·

CC 4.0 BY-SA版权

文章标签：

#概率论

概率论专栏收录该内容

2 篇文章

订阅专栏

本文详细探讨了离散和连续随机变量的联合分布，包括频率函数、累积分布函数和密度函数。此外，还介绍了如何计算边缘分布，并阐述了随机变量独立性的概念。进一步讲解了条件分布的离散和连续情况，以及如何从联合分布导出随机变量函数如和与商的分布。最后，讨论了顺序统计量和极值的密度函数。

联合分布

部分公式是自己推导的，有不对的地方请说出来 QAQ

离散随机变量

假设 $X$ 和 $Y$ 是定义在同一样本空间上的离散随机变量，它们的联合频率函数是 $p(x_i, y_i) = P(X=x_i, Y = y_i)$ 。

$PX(x)=∑ip(x,yi)P_X(x) = \sum_i p(x, y_i)$ 为 $X$ 的边际频率函数， $P_Y$ 的定义类似。

连续随机变量

假设 $X$ 和 $Y$ 是具有累积分布函数 $F (x, y)$ 的连续型随机变量，它们的联合密度函数是两变量的分段连续函数。

$\int_{-\infty}^x \int_{-\infty}^y f(u, v)dvdu$ 。

那么在导数定义存在的情况下， $\frac{\partial^2}{\partial x \partial y} F(x, y)$ 。

$(X, Y)$ 落入 $(x, y)$ 的较小邻域概率与 $f (x, y)$ 成比例： $P(x≤X≤x+dx,y≤Y≤y+dy)=f(x,y)dxdyP(x\leq X \leq x+dx, y\leq Y \leq y+dy)=f(x, y)dxdy$ 。

$X$ 的边际累积分布函数： $FX(x)=P(X≤x)=∫−∞x∫−∞+∞f(u,y)dyduF_X(x) = P(X\leq x) = \int_{-\infty}^x \int_{-\infty}^{+\infty}f(u, y)dydu$ 。

$X$ 的边际密度函数为： $fX(x)=FX′(x)=∫−∞+∞f(x,y)dyf_X(x) = F_X'(x) = \int_{-\infty}^{+\infty}f(x, y)dy$ 。

独立随机变量

定义

随机变量 $X1,…,XnX_1,\dots,X_n$ 称为独立的，如果 $∀xi\forall x_i$ ，它们联合累积分布函数可分解成各自边际累积分布函数之积 $F(x1,…,xn)=∏F(Xi)F(x_1,\dots,x_n) = \prod F(X_i)$ ，该定义对离散型和连续型随机变量都是成立的。

对于离散型随机变量，等价的叙述为：分解联合频率函数。

对于连续型随机变量，等价的叙述为：分解联合密度函数。

条件分布

离散情形

如果 $X$ 和 $Y$ 是离散随机变量，给定 $Y=y_j$ 的情况下 $X=x_i$ 的条件概率是：如果 $p_Y(y_j)>0$ ，那么
$P(X=x_i|Y=y_j) = \frac{P(X=x_i, Y=y_j)}{P(Y=y_i)} = \frac{p_{XY}(x_i, y_j)}{p_Y(y_j)}$
也可以重新表述为：
$p_{XY}(x, y) = p_{X|Y}(x|y)p_Y(y)$

连续情形

如果 $f_Y(y)>0$ ，那么
$f_{XY}(x, y) = f_{X|Y}(x|y)f_Y(y)$
否则为 $0$ 。

联合分布随机变量函数

首先考虑一些重要的特殊情形：

和与商

和

对于离散形式，设 $X, Y$ 为离散型随机变量，具有联合频率函数 $p (x, y)$ ，令 $Z = X + Y$ ，那么 $Z$ 的频率函数为：
$p_Z(z) = \sum_{i=-\infty}^\infty p(x, z-x)$
这个和称为序列 $p_X,p_Y$ 的卷积。

对于连续形式，设 $X, Y$ 为连续型随机变量，我们首先计算 $Z = X + Y$ 的累积分布函数 $F_Z$ 。
$KaTeX parse error: Undefined control sequence: \ce at position 108: …(x, y)dydx \\ &\̲c̲e̲{\overset{v=x+y…$

$∫−∞+∞f(x,v−x)dx\int_{-\infty}^{+\infty} f(x, v-x)dx$ 可以看作是 $g (v)$ （关于 $v$ 的函数）。

那么 $fZ(z)=∫−∞+∞f(x,z−x)dxf_Z(z) = \int_{-\infty}^{+\infty} f(x, z-x)dx$ 。

如果 $X, Y$ 独立，那么 $fZ(z)=∫−∞+∞fX(x)fY(z−x)dxf_Z(z) = \int_{-\infty}^{+\infty} f_X(x) f_Y(z-x)dx$

商

下考虑两个随机变量的商。

$Z = Y / X$ ，推导的方式类似于上述和的推导方式可以得到结果，这里采取另一种方法：利用二重积分的变量替换。

令：
$\begin{cases} u = y/x\\ v=x \end{cases}$
那么有：

$FZ(z)=∫−∞z∫−∞+∞f(v,uv)∣J∣dvduF_Z(z) = \int_{-\infty}^{z} \int_{-\infty}^{+\infty} f(v, uv)|J|dvdu$

其中 $\frac{\partial (x, y)}{\partial (u, v)}$ ，这里的 $∣ J ∣$ 是 $J$ 的绝对值。

化简即可得到 $FZ(z)=∫−∞z∫−∞+∞∣x∣f(x,xv)dxdvF_Z(z) = \int_{-\infty}^{z} \int_{-\infty}^{+\infty} |x|f(x, xv)dxdv$

因此 $fZ(z)=∫−∞+∞∣x∣f(x,xz)dxf_Z(z) = \int_{-\infty}^{+\infty} |x|f(x, xz)dx$

如果 $X, Y$ 独立， $fZ(z)=∫−∞+∞∣x∣fX(x)fY(xz)dxf_Z(z) = \int_{-\infty}^{+\infty} |x|f_X(x) f_Y(xz)dx$ 。

一般情形

利用类似于上面使用雅可比行列式求随机变量的商的方法，我们可以得到多个随机变量函数的一般情形。

假设 $X, Y$ 是连续型随机变量，通过 $g_1,g_2$ 投影到 $U, V$ 上： $u=g_1(x, y),v=g_2(x, y)$ 。

同时存在逆变换 $x=h_1(u, v),y=h_2(u, v)$ ，那么有
$f_{UV}(u, v) = f_{XY}(h_1(u,v),h_2(u,v))|J^{-1}(h_1(u, v), h_2(u, v))|$

不难注意到这个公式和一维公式的形式是非常接近的。

极值与顺序统计量

假设 $X1,…,XnX_1,\dots,X_n$ 是具有密度 $f (x)$ 的独立连续型随机变量，对 $X_i$ 排序，记 $X(1)<⋯<X(n)X_{(1)}<\dots<X_{(n)}$ 为顺序统计量，现求 $X_{(k)}$ 的密度函数 $f_{k}(x)$ 。

用先求分布函数然后微分的方法比较复杂。

因为分布函数为 $Fk(x)=∑i=knCni[F(x)]i[1−F(x)]n−iF_k(x) = \sum_{i=k}^n C_n^i[F(x)]^i[1-F(x)]^{n-i}$ 。

~~然后接下来我不会化了~~

注意到事件（已排列好） $x≤X(k)≤x+dxx\leq X_{(k)} \leq x+dx$ 发生的概率为：
$F(x)]^{k-1}[1-F(x)]^{n-k}f(x)dx$
因此密度函数为：
$\begin{aligned} f_k(x) &= C_n^{k-1}C_{n-(k-1)}^1[F(x)]^{k-1}[1-F(x)]^{n-k}f(x)\\ &= \frac{n!}{(k-1)!(n-k)!}[F(x)]^{k-1}[1-F(x)]^{n-k}f(x) \end{aligned}$
至于极值（极大值、极小值）的密度函数便分别为上式 $k = n, 1$ 的结果。