【概率论】联合分布

本文详细探讨了离散和连续随机变量的联合分布,包括频率函数、累积分布函数和密度函数。此外,还介绍了如何计算边缘分布,并阐述了随机变量独立性的概念。进一步讲解了条件分布的离散和连续情况,以及如何从联合分布导出随机变量函数如和与商的分布。最后,讨论了顺序统计量和极值的密度函数。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

联合分布

部分公式是自己推导的,有不对的地方请说出来 QAQ

离散随机变量

假设 XXXYYY 是定义在同一样本空间上的离散随机变量,它们的联合频率函数是 p(xi,yi)=P(X=xi,Y=yi)p(x_i, y_i) = P(X=x_i, Y = y_i)p(xi,yi)=P(X=xi,Y=yi)

PX(x)=∑ip(x,yi)P_X(x) = \sum_i p(x, y_i)PX(x)=ip(x,yi)​ 为 XXX​ 的边际频率函数PYP_YPY 的定义类似。

连续随机变量

假设 XXX​​ 和 YYY​​ 是具有累积分布函数 F(x,y)F(x, y)F(x,y)​​ 的连续型随机变量,它们的联合密度函数是两变量的分段连续函数。

F(x,y)=∫−∞x∫−∞yf(u,v)dvduF(x, y) = \int_{-\infty}^x \int_{-\infty}^y f(u, v)dvduF(x,y)=xyf(u,v)dvdu

那么在导数定义存在的情况下,f(x,y)=∂2∂x∂yF(x,y)f(x, y) = \frac{\partial^2}{\partial x \partial y} F(x, y)f(x,y)=xy2F(x,y)

(X,Y)(X, Y)(X,Y) 落入 (x,y)(x, y)(x,y) 的较小邻域概率与 f(x,y)f(x, y)f(x,y) 成比例:P(x≤X≤x+dx,y≤Y≤y+dy)=f(x,y)dxdyP(x\leq X \leq x+dx, y\leq Y \leq y+dy)=f(x, y)dxdyP(xXx+dx,yYy+dy)=f(x,y)dxdy

XXX边际累积分布函数FX(x)=P(X≤x)=∫−∞x∫−∞+∞f(u,y)dyduF_X(x) = P(X\leq x) = \int_{-\infty}^x \int_{-\infty}^{+\infty}f(u, y)dyduFX(x)=P(Xx)=x+f(u,y)dydu​。

XXX​ 的边际密度函数为fX(x)=FX′(x)=∫−∞+∞f(x,y)dyf_X(x) = F_X'(x) = \int_{-\infty}^{+\infty}f(x, y)dyfX(x)=FX(x)=+f(x,y)dy​​。

独立随机变量

定义

随机变量 X1,…,XnX_1,\dots,X_nX1,,Xn​​​​​ 称为独立的,如果 ∀xi\forall x_ixi​​​​​,它们联合累积分布函数可分解成各自边际累积分布函数之积 F(x1,…,xn)=∏F(Xi)F(x_1,\dots,x_n) = \prod F(X_i)F(x1,,xn)=F(Xi)​​​​,该定义对离散型连续型随机变量都是成立的。

对于离散型随机变量,等价的叙述为:分解联合频率函数。

对于连续型随机变量,等价的叙述为:分解联合密度函数。

条件分布

离散情形

如果 XXXYYY 是离散随机变量,给定 Y=yjY=y_jY=yj 的情况下 X=xiX=x_iX=xi 的条件概率是:如果 pY(yj)>0p_Y(y_j)>0pY(yj)>0​,那么
P(X=xi∣Y=yj)=P(X=xi,Y=yj)P(Y=yi)=pXY(xi,yj)pY(yj) P(X=x_i|Y=y_j) = \frac{P(X=x_i, Y=y_j)}{P(Y=y_i)} = \frac{p_{XY}(x_i, y_j)}{p_Y(y_j)} P(X=xiY=yj)=P(Y=yi)P(X=xi,Y=yj)=pY(yj)pXY(xi,yj)
也可以重新表述为:
pXY(x,y)=pX∣Y(x∣y)pY(y) p_{XY}(x, y) = p_{X|Y}(x|y)p_Y(y) pXY(x,y)=pXY(xy)pY(y)

连续情形

如果 fY(y)>0f_Y(y)>0fY(y)>0​,那么
fXY(x,y)=fX∣Y(x∣y)fY(y) f_{XY}(x, y) = f_{X|Y}(x|y)f_Y(y) fXY(x,y)=fXY(xy)fY(y)
否则为 000

联合分布随机变量函数

首先考虑一些重要的特殊情形:

和与商

对于离散形式,设 X,YX,YX,Y 为离散型随机变量,具有联合频率函数 p(x,y)p(x, y)p(x,y),令 Z=X+YZ = X+YZ=X+Y,那么 ZZZ 的频率函数为:
pZ(z)=∑i=−∞∞p(x,z−x) p_Z(z) = \sum_{i=-\infty}^\infty p(x, z-x) pZ(z)=i=p(x,zx)
这个和称为序列 pX,pYp_X,p_YpX,pY 的卷积。

对于连续形式,设 X,YX,YX,Y 为连续型随机变量,我们首先计算 Z=X+YZ=X+YZ=X+Y 的累积分布函数 FZF_ZFZ
KaTeX parse error: Undefined control sequence: \ce at position 108: …(x, y)dydx \\ &\̲c̲e̲{\overset{v=x+y…

∫−∞+∞f(x,v−x)dx\int_{-\infty}^{+\infty} f(x, v-x)dx+f(x,vx)dx 可以看作是 g(v)g(v)g(v)(关于 vvv 的函数)。​

那么 fZ(z)=∫−∞+∞f(x,z−x)dxf_Z(z) = \int_{-\infty}^{+\infty} f(x, z-x)dxfZ(z)=+f(x,zx)dx​。

如果 X,YX,YX,Y​​ 独立,那么 fZ(z)=∫−∞+∞fX(x)fY(z−x)dxf_Z(z) = \int_{-\infty}^{+\infty} f_X(x) f_Y(z-x)dxfZ(z)=+fX(x)fY(zx)dx​​

下考虑两个随机变量的商。

Z=Y/XZ = Y/XZ=Y/X​​,推导的方式类似于上述和的推导方式可以得到结果,这里采取另一种方法:利用二重积分的变量替换。

令:
{u=y/xv=x \begin{cases} u = y/x\\ v=x \end{cases} {u=y/xv=x
那么有:

FZ(z)=∫−∞z∫−∞+∞f(v,uv)∣J∣dvduF_Z(z) = \int_{-\infty}^{z} \int_{-\infty}^{+\infty} f(v, uv)|J|dvduFZ(z)=z+f(v,uv)Jdvdu

其中 J=∂(x,y)∂(u,v)J = \frac{\partial (x, y)}{\partial (u, v)}J=(u,v)(x,y),这里的 ∣J∣|J|JJJJ 的绝对值。​

化简即可得到 FZ(z)=∫−∞z∫−∞+∞∣x∣f(x,xv)dxdvF_Z(z) = \int_{-\infty}^{z} \int_{-\infty}^{+\infty} |x|f(x, xv)dxdvFZ(z)=z+xf(x,xv)dxdv​​

因此 fZ(z)=∫−∞+∞∣x∣f(x,xz)dxf_Z(z) = \int_{-\infty}^{+\infty} |x|f(x, xz)dxfZ(z)=+xf(x,xz)dx

如果 X,YX,YX,Y 独立,fZ(z)=∫−∞+∞∣x∣fX(x)fY(xz)dxf_Z(z) = \int_{-\infty}^{+\infty} |x|f_X(x) f_Y(xz)dxfZ(z)=+xfX(x)fY(xz)dx​。

一般情形

利用类似于上面使用雅可比行列式求随机变量的商的方法,我们可以得到多个随机变量函数的一般情形。

假设 X,YX,YX,Y 是连续型随机变量,通过 g1,g2g_1,g_2g1,g2 投影到 U,VU,VU,V 上:u=g1(x,y),v=g2(x,y)u=g_1(x, y),v=g_2(x, y)u=g1(x,y),v=g2(x,y)

同时存在逆变换 x=h1(u,v),y=h2(u,v)x=h_1(u, v),y=h_2(u, v)x=h1(u,v),y=h2(u,v),那么有
fUV(u,v)=fXY(h1(u,v),h2(u,v))∣J−1(h1(u,v),h2(u,v))∣ f_{UV}(u, v) = f_{XY}(h_1(u,v),h_2(u,v))|J^{-1}(h_1(u, v), h_2(u, v))| fUV(u,v)=fXY(h1(u,v),h2(u,v))J1(h1(u,v),h2(u,v))

不难注意到这个公式和一维公式的形式是非常接近的。

极值与顺序统计量

假设 X1,…,XnX_1,\dots,X_nX1,,Xn​ 是具有密度 f(x)f(x)f(x)​ 的独立连续型随机变量,对 XiX_iXi 排序,记 X(1)<⋯<X(n)X_{(1)}<\dots<X_{(n)}X(1)<<X(n) 为顺序统计量,现求 X(k)X_{(k)}X(k) 的密度函数 fk(x)f_{k}(x)fk(x)

用先求分布函数然后微分的方法比较复杂。

因为分布函数为 Fk(x)=∑i=knCni[F(x)]i[1−F(x)]n−iF_k(x) = \sum_{i=k}^n C_n^i[F(x)]^i[1-F(x)]^{n-i}Fk(x)=i=knCni[F(x)]i[1F(x)]ni

然后接下来我不会化了

注意到事件(已排列好) x≤X(k)≤x+dxx\leq X_{(k)} \leq x+dxxX(k)x+dx​ 发生的概率为:
[F(x)]k−1[1−F(x)]n−kf(x)dx [F(x)]^{k-1}[1-F(x)]^{n-k}f(x)dx [F(x)]k1[1F(x)]nkf(x)dx
因此密度函数为:
fk(x)=Cnk−1Cn−(k−1)1[F(x)]k−1[1−F(x)]n−kf(x)=n!(k−1)!(n−k)![F(x)]k−1[1−F(x)]n−kf(x) \begin{aligned} f_k(x) &= C_n^{k-1}C_{n-(k-1)}^1[F(x)]^{k-1}[1-F(x)]^{n-k}f(x)\\ &= \frac{n!}{(k-1)!(n-k)!}[F(x)]^{k-1}[1-F(x)]^{n-k}f(x) \end{aligned} fk(x)=Cnk1Cn(k1)1[F(x)]k1[1F(x)]nkf(x)=(k1)!(nk)!n![F(x)]k1[1F(x)]nkf(x)
至于极值(极大值、极小值)的密度函数便分别为上式 k=n,1k=n,1k=n,1​ 的结果。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值