1024快乐!
边缘分布
相关概念
形式
边缘分布函数
FX(x)=F(x,∞),FY(y)=F(∞,y) F_X(x)=F(x,\infin),\quad F_Y(y)=F(\infin,y) FX(x)=F(x,∞),FY(y)=F(∞,y)
边缘分布律
pi⋅=∑j=1∞pij=P{X=xi},p⋅j=∑i=1∞pij=P{Y=yj} p_{i\cdot}=\sum_{j=1}^\infin p_{ij}=P\{X=x_i\},\quad p_{\cdot j}=\sum_{i=1}^{\infin}p_{ij}=P\{Y=y_j\} pi⋅=j=1∑∞pij=P{X=xi},p⋅j=i=1∑∞pij=P{Y=yj}
由于我们经常将边缘分布律写在联合分布律表格的边缘上,这就是“边缘分布律”这个词的来源。
边缘概率密度函数
fX(x)=∫−∞∞f(x,y)dy,fY(y)=∫−∞∞f(x,y)dx f_X(x)=\int_{-\infin}^{\infin}f(x,y){\rm d}y,f_Y(y)=\int_{-\infin}^{\infin}f(x,y){\rm d}x fX(x)=∫−∞∞f(x,y)dy,fY(y)=∫−∞∞f(x,y)dx
推导
FX(x)=P{X≤x}=P{X≤x,Y<∞}=F(x,∞) F_X(x)=P\{X\leq x\}=P\{X\leq x,Y<\infin\}=F(x,\infin) FX(x)=P{X≤x}=P{X≤x,Y<∞}=F(x,∞)
fX(x)=ddxF(x,∞)=ddx∫−∞x[∫−∞∞f(x,y)dy]dx=∫−∞∞f(x,y)dy \begin{aligned} f_X(x) &=\frac{\rm d}{{\rm d}x}F(x,\infin) =\frac{\rm d}{{\rm d}x}\int_{-\infin}^x[\int_{-\infin}^{\infin}f(x,y){\rm d}y]{\rm d}x \\ &=\int_{-\infin}^{\infin}f(x,y){\rm d}y \end{aligned} fX(x)=dxdF(x,∞)=dxd∫−∞x[∫−∞∞f(x,y)dy]dx=∫−∞∞f(x,y)dy
注意
- 求解关于某个随机变量的概率分布函数时,例如fX(x)f_X(x)fX(x),需要注意是按xxx划分分类函数的区间,而不是看积yyy就用yyy划。
- 边缘分布不能确定联合分布
特殊的边缘分布
- 二维联合正态分布的边缘分布是一维正态分布;
- 多项分布的边缘分布是二项分布;
- 多维超几何分布的边缘分布是超几何分布;
- 二维均匀分布的边缘分布不一定是均匀分布。
证明
- (X,Y)(X,Y)(X,Y)的联合概率密度函数为
p(x,y)=12πσ1σ2cexp[−12c2(a2+b2−2ρab)] p(x,y)=\frac{1}{2\pi \sigma_1\sigma_2 c}{\rm exp}[-\frac{1}{2c^2}(a^2+b^2-2\rho ab)] p(x,y)=2πσ1σ2c1exp[−2c21(a2+b2−2ρab)]
其中a=x−μ1σ1,b=y−μ2σ2,c=1−ρ2a=\frac{x-\mu_1}{\sigma_1},b=\frac{y-\mu_2}{\sigma_2},c=\sqrt{1-\rho^2}a=σ1x−μ1,b=σ2y−μ2,c=1−ρ2.
于是,
pX(x)=∫−∞∞p(x,y)dy=∫−∞∞12πσ1σ2cexp[−12c2(a2+b2−2ρab)]dy=12πσ1exp(−a22)∫−∞∞12πcexp(−(b−ρa)22c2)db=12πσ1exp(−a22)=12πσ1exp(−(x−μ1)22σ12)
\begin{aligned}
p_X(x)
&=\int_{-\infin}^{\infin}p(x,y){\rm d}y
=\int_{-\infin}^{\infin}\frac{1}{2\pi \sigma_1\sigma_2 c}{\rm exp}[-\frac{1}{2c^2}(a^2+b^2-2\rho ab)]{\rm d}y \\
&=\frac{1}{\sqrt{2\pi}\sigma_1}{\rm exp}({-\frac{a^2}{2}})\int_{-\infin}^{\infin}\frac{1}{\sqrt{2\pi}c}{\rm exp}(-\frac{(b-\rho a)^2}{2c^2}){\rm d}b \\
&=\frac{1}{\sqrt{2\pi}\sigma_1}{\rm exp}({-\frac{a^2}{2}}) \\
&=\frac{1}{\sqrt{2\pi}\sigma_1}{\rm exp}({-\frac{(x-\mu_1)^2}{2\sigma_1^2}})
\end{aligned}
pX(x)=∫−∞∞p(x,y)dy=∫−∞∞2πσ1σ2c1exp[−2c21(a2+b2−2ρab)]dy=2πσ11exp(−2a2)∫−∞∞2πc1exp(−2c2(b−ρa)2)db=2πσ11exp(−2a2)=2πσ11exp(−2σ12(x−μ1)2)
大体思路是构造关于bbb的正态分布,这一思想在很多题目中适用。
随机变量函数的分布
Z=X+YZ=X+YZ=X+Y
离散型
卷积公式
pij=P(X=x1,Y=yj) p_{ij}=P(X=x_1,Y=y_j) pij=P(X=x1,Y=yj)
P(Z=zk)=∑iP(X=xi,Y=zk−xi)=∑jP(X=zk−yj,Y=yj) P(Z=z_k)=\sum_i P(X=x_i,Y=z_k-x_i)=\sum_j P(X=z_k-y_j,Y=y_j) P(Z=zk)=i∑P(X=xi,Y=zk−xi)=j∑P(X=zk−yj,Y=yj)
若X,YX,YX,Y相互独立,上式可化为
P(Z=zk)=∑iP(X=xi)P(Y=zk−xi)=∑jP(X=zk−yj)P(Y=yj)
P(Z=z_k)=\sum_i P(X=x_i)P(Y=z_k-x_i)=\sum_j P(X=z_k-y_j)P(Y=y_j)
P(Z=zk)=i∑P(X=xi)P(Y=zk−xi)=j∑P(X=zk−yj)P(Y=yj)
可加性
二项分布
泊松分布
连续型
特殊的均匀分布
设随机变量XXX的分布函数F(x)F(x)F(x)是严格单调递增的连续函数,则随机变量Y=F(X)Y=F(X)Y=F(X)服从均匀分布U(0,1)U(0,1)U(0,1).
证明
严格单调递增:确保存在反函数
FY(y)=P(F(X)≤y)={0,y<0P(X≤F−1(y)),0≤y<11,y≥1={0,y<0F(F−1(y)),0≤y<11,y≥1={0,y<0y,0≤y<11,y≥1
\begin{aligned}
F_Y(y)&=P(F(X)\leq y)=
\begin{cases}
0, & y<0 \\
P(X\leq F^{-1}(y)), & 0\leq y<1\\
1, & y\geq 1
\end{cases} \\
&=
\begin{cases}
0, & y<0 \\
F(F^{-1}(y)),& 0\leq y<1\\
1, & y\geq 1
\end{cases} \\
&=
\begin{cases}
0, & y<0 \\
y,& 0\leq y<1\\
1, & y\geq 1
\end{cases}
\end{aligned}
FY(y)=P(F(X)≤y)=⎩⎪⎨⎪⎧0,P(X≤F−1(y)),1,y<00≤y<1y≥1=⎩⎪⎨⎪⎧0,F(F−1(y)),1,y<00≤y<1y≥1=⎩⎪⎨⎪⎧0,y,1,y<00≤y<1y≥1
意义
任何一个连续随机变量可以通过分布函数与均匀分布建立联系。
可以先生成均匀分布的随机数y1,⋯ ,yny_1,\cdots,y_ny1,⋯,yn,再通过F(xi)=yiF(x_i)=y_iF(xi)=yi求得x1,⋯ ,xnx_1,\cdots, x_nx1,⋯,xn,从而获得满足给定分布函数的连续随机变量取值。
卷积公式
pX+Y(z)=∫−∞∞p(z−y,y)dy=∫−∞∞p(x,z−x)dx p_{X+Y}(z)=\int_{-\infin}^{\infin}p(z-y,y){\rm d}y=\int_{-\infin}^{\infin}p(x,z-x){\rm d}x pX+Y(z)=∫−∞∞p(z−y,y)dy=∫−∞∞p(x,z−x)dx
若X,YX,YX,Y相互独立,上式可化为
pX+Y(z)=∫−∞∞pX(z−y)pY(y)dy=∫−∞∞pX(x)pY(z−x)dx
p_{X+Y}(z)=\int_{-\infin}^{\infin}p_X(z-y)p_Y(y){\rm d}y=\int_{-\infin}^{\infin}p_X(x)p_Y(z-x){\rm d}x
pX+Y(z)=∫−∞∞pX(z−y)pY(y)dy=∫−∞∞pX(x)pY(z−x)dx
记fXf_XfX和fYf_YfY为的卷积公式
fX∗fY
f_X * f_Y
fX∗fY
推导
FZ(z)=∬x+y≤zp(x,y)dxdy=∫−∞∞dy∫−∞z−yp(x,y)dx=∫−∞∞dy∫−∞zp(u−y,y)du=∫−∞zdu∫−∞∞p(u−y,y)dy \begin{aligned} F_Z(z) &=\iint_{x+y\leq z}p(x,y){\rm d}x{\rm d}y =\int_{-\infin}^{\infin}{\rm d}y\int_{-\infin}^{z-y}p(x,y){\rm d}x \\ &=\int_{-\infin}^{\infin}{\rm d}y\int_{-\infin}^zp(u-y,y){\rm d}u =\int_{-\infin}^{z}{\rm d}u\int_{-\infin}^{\infin}p(u-y,y){\rm d}y \end{aligned} FZ(z)=∬x+y≤zp(x,y)dxdy=∫−∞∞dy∫−∞z−yp(x,y)dx=∫−∞∞dy∫−∞zp(u−y,y)du=∫−∞zdu∫−∞∞p(u−y,y)dy
对zzz求导可得。
可加性
正态分布
-
若Xi∼N(μi,σi2),i=1,2,⋯ ,nX_i\sim N(\mu_i,\sigma_i^2),i=1,2,\cdots,nXi∼N(μi,σi2),i=1,2,⋯,n,且它们相互独立,则Z=X1+X2+⋅XnZ=X_1+X_2+\cdot X_nZ=X1+X2+⋅Xn也满足正态分布,且Z∼N(μ1+μ2+⋯+μn,σ12+σ22+⋯+σn2)Z\sim N(\mu_1+\mu_2+\cdots +\mu_n,\sigma_1^2+\sigma_2^2+\cdots +\sigma_n^2)Z∼N(μ1+μ2+⋯+μn,σ12+σ22+⋯+σn2)。
-
有限个相互独立的正态随机变量的线性组合仍然服从正态分布。
Gamma{\rm Gamma}Gamma分布
Z=YX,Z=XYZ=\frac{Y}{X},Z=XYZ=XY,Z=XY
pY/X(z)=∫−∞∞∣x∣p(x,xz)dx p_{Y/X}(z)=\int_{-\infin}^{\infin}|x|p(x,xz){\rm d}x pY/X(z)=∫−∞∞∣x∣p(x,xz)dx
pXY(z)=∫−∞∞1∣x∣p(x,zx)dx p_{XY}(z)=\int_{-\infin}^{\infin}\frac{1}{|x|}p(x,\frac{z}{x}){\rm d}x pXY(z)=∫−∞∞∣x∣1p(x,xz)dx
若X,YX,YX,Y相互独立,上式可化为
pY/X(z)=∫−∞∞∣x∣pX(x)pY(xz)dx
p_{Y/X}(z)=\int_{-\infin}^{\infin}|x|p_X(x)p_Y(xz){\rm d}x
pY/X(z)=∫−∞∞∣x∣pX(x)pY(xz)dx
pXY(z)=∫−∞∞1∣x∣pX(x)pY(zx)dx p_{XY}(z)=\int_{-\infin}^{\infin}\frac{1}{|x|}p_X(x)p_Y(\frac{z}{x}){\rm d}x pXY(z)=∫−∞∞∣x∣1pX(x)pY(xz)dx
推导
需要注意x<0x<0x<0部分的符号变化。
FY/X(z)=P(Y/X≤z)=∬y/x≤z,x<0p(x,y)dxdy+∬y/x≤z,x>0p(x,y)dxdy=∫−∞0dx∫zx∞p(x,y)dy+∫0∞dx∫−∞zxp(x,y)dy=y=xu∫−∞0dx∫z−∞xp(x,xu)du+∫0∞dx∫−∞zxp(x,xu)du=∫−∞0dx∫z−∞(−x)p(x,xu)du+∫0∞dx∫−∞zxp(x,xu)du=∫−∞∞dx∫−∞z∣x∣p(x,xu)du=∫−∞zdu∫−∞∞∣x∣p(x,xu)dx
\begin{aligned}
F_{Y/X}(z)
&= P(Y/X\leq z)
=\iint_{y/x\leq z,x<0}p(x,y){\rm d}x{\rm d}y+\iint_{y/x\leq z,x>0}p(x,y){\rm d}x{\rm d}y \\
&=\int_{-\infin}^0{\rm d}x\int_{zx}^{\infin}p(x,y){\rm d}y+\int_0^{\infin}{\rm d}x\int_{-\infin}^{zx}p(x,y){\rm d}y \\
&\stackrel{y=xu}=\int_{-\infin}^0{\rm d}x\int_{z}^{-\infin}xp(x,xu){\rm d}u+\int_0^{\infin}{\rm d}x\int_{-\infin}^{z}xp(x,xu){\rm d}u \\
&=\int_{-\infin}^0{\rm d}x\int_{z}^{-\infin}(-x)p(x,xu){\rm d}u+\int_0^{\infin}{\rm d}x\int_{-\infin}^{z}xp(x,xu){\rm d}u \\
&=\int_{-\infin}^{\infin}{\rm d}x\int_{-\infin}^{z}|x|p(x,xu){\rm d}u \\
&=\int_{-\infin}^{z}{\rm d}u\int_{-\infin}^{\infin}|x|p(x,xu){\rm d}x
\end{aligned}
FY/X(z)=P(Y/X≤z)=∬y/x≤z,x<0p(x,y)dxdy+∬y/x≤z,x>0p(x,y)dxdy=∫−∞0dx∫zx∞p(x,y)dy+∫0∞dx∫−∞zxp(x,y)dy=y=xu∫−∞0dx∫z−∞xp(x,xu)du+∫0∞dx∫−∞zxp(x,xu)du=∫−∞0dx∫z−∞(−x)p(x,xu)du+∫0∞dx∫−∞zxp(x,xu)du=∫−∞∞dx∫−∞z∣x∣p(x,xu)du=∫−∞zdu∫−∞∞∣x∣p(x,xu)dx
对zzz求导即可。
M=max{X,Y},N=min{X,Y}M={\rm max}\{X,Y\},N={\rm min}\{X,Y\}M=max{X,Y},N=min{X,Y}
若==X,YX,YX,Y相互独立==,则
Fmax(z)=FX(z)FY(z)
F_{\rm max}(z)=F_X(z)F_Y(z)
Fmax(z)=FX(z)FY(z)
Fmin(z)=1−[1−FX(z)][1−FY(z)] F_{\rm min}(z)=1-[1-F_X(z)][1-F_Y(z)] Fmin(z)=1−[1−FX(z)][1−FY(z)]
推广到nnn个相互独立的随机变量情况,
Fmax(z)=∏iFXi(z)
F_{\rm max}(z)=\prod_{i}F_{X_i}(z)
Fmax(z)=i∏FXi(z)
Fmin(z)=1−∏i(1−FXi(z)) F_{\rm min}(z)=1-\prod_{i}(1-F_{X_i}(z)) Fmin(z)=1−i∏(1−FXi(z))
推导
Fmax(z)=P{M≤z}=P{X≤z,Y≤z}=P{X≤z}P{Y≤z}=FX(z)FY(z) \begin{aligned} F_{\rm max}(z) &=P\{M\leq z\} =P\{X\leq z,Y\leq z\} \\ &= P\{X\leq z\}P\{Y\leq z\} \\ &=F_X(z)F_Y(z) \end{aligned} Fmax(z)=P{M≤z}=P{X≤z,Y≤z}=P{X≤z}P{Y≤z}=FX(z)FY(z)
Fmin(z)=P{N≤z}=1−P{N>z}=1−P{X>z,Y>z}=1−P{X>z}P{Y>z}=1−[1−FX(z)][1−FY(z)] \begin{aligned} F_{\rm min}(z) &=P\{N\leq z\} =1-P\{N>z\} \\ &=1-P\{X>z,Y>z\} \\ &=1-P\{X>z\}P\{Y>z\} \\ &=1-[1-F_X(z)][1-F_Y(z)] \end{aligned} Fmin(z)=P{N≤z}=1−P{N>z}=1−P{X>z,Y>z}=1−P{X>z}P{Y>z}=1−[1−FX(z)][1−FY(z)]