前面的文章中提到,两个连续型随机变量的两个函数联合pdf 的行列式基本上是数学分析中处理二重积分变换变换时一个定理的推论,这个定理自然可以扩展到n重积分,考虑n维空间S的子集A上的积分形式
∫A⋯∫h(x1,x2,…,xn)dx1dx2⋯dxn
令
y1=u1(x1,x2,…,xn),y2=u2(x1,x2,…,xn),…,yn=un(x1,x2,…,xn)
是将S映射到y1,y2,…,yn所在T空间的一对一变换,因此就将S的子集A映射到T的子集B,另外其逆函数为
x1=w1(y1,y2,…,yn),x2=w2(y1,y2,…,yn),…,xn=wn(y1,y2,…,yn)
。令逆函数的一阶偏导为连续的且n×n的行列式(称为雅克比)
J=∣∣∣∣∣∣∣∣∣∣∣∂x1∂y1∂x2∂y1⋮∂xn∂y1∂x1∂y2∂x2∂y2⋮∂xn∂y2⋯⋯⋯∂x1∂yn∂x2∂yn⋮∂xn∂yn∣∣∣∣∣∣∣∣∣∣∣
不等于T中的零,那么
∫A⋯∫h(x1,x2,…,xn)dx1dx2⋯dxn=∫B⋯∫h[w1(y1,…,yn),w2(y1,…,yn),…,wn(y1,…,yn)]|J|dy1dy2⋯dyn
只要这个定理的条件满足,我们就能确定n个随机变量的n个函数的联合pdf。
例1:令X1,X2,X3的联合pdf为
h(x1,x2,x3)={48x1x2x300<x1<x2<x3<1elsewhere
如果Y1=X1/X2,Y2=X2/X3,Y3=X3,那么逆变换为
x1=y1y2y3,x2=y2y3,x3=y3
雅克比为
J=∣∣∣∣∣y2y300y1y3y30y1y2y21∣∣∣∣∣=y2y23
定义在支撑上的不等式等价于
0<y1y2y3,y1y2y3<y2y3,y2y3<y3,y3<1
变为Y1,Y2,Y3的支撑T={(y1,y2,y3):0<yi<1,i=1,2,3}。因此Y1,Y2,Y3的联合pdf为
g(y1,y2,y3)=48(y1y2y3)(y2y3)y3|y2y23|={48y1y32y5300<yi<1,i=1,2,3elsewhere
边缘pdf为
g1(y1)=2y1,0<y1<1,zero elsewhere,g2(y2)=4y32,0<y2<1,zero elsewhere,g3(y3)=6y53,0<y3<1,zero elsewhere
因为g(y1,y2,y3)=g1(y1)g2(y2)g3(y3),所以随机变量Y1,Y2,Y3互相独立。
例2:令X1,X2,X3是独立同分布的随机变量,其共同的pdf为
f(x)={e−x00<x<∞elsewhere
所以X1,X2,X3的联合pdf为
fX1,X2,X3(x1,x2,x3)={e−Σ3i=1xi00<xi<∞,i=1,2,3elsewhere
考虑随机变量Y1,Y2,Y3,定义为
Y1=X1X1+X2+X3,Y2=X2X1+X2+X3,Y3=X1+X2+X3
因此逆变换为
x1=y1y3,x2=y2y3,x3=y3−y1y3−y2y3
其雅克比为
J=∣∣∣∣∣y30−y30y3−y3y1y21−y1−y2∣∣∣∣∣=y23
X1,X2,X3的支撑映射到
0<y1y3<∞,0<y2y3<∞,0<y3(1−y1−y2)<∞
这等价于
T={(y1,y2,y3):0<y1,0<y2,0<1−y1−y2,0<y3<∞}
因此Y1,Y2,Y3的联合pdf为
g(y1,y2,y3)=y23e−y3,(y1,y2,y3)∈T
Y1的边缘pdf为
g1(y1)=∫1−y10∫∞0y23e−y3dy3dy2=2(1−y1),0<y1<1
其他地方为零。同样的Y2的边缘pdf为
g2(y2)=2(1−y2), 0<y2<1
其他地方为零,而Y3的pdf为
g3(y3)=∫10∫1−y10y23e−y3dy2dy1=12y23e−y3, 0<y3<∞
其他地方为零。因为g(y1,y2,y3)≠g1(y1)g2(y2)g3(y3),所以Y1,Y2,Y3是相关的随机变量。
然而,注意Y1,Y3的联合pdf为
g13(y1,y3)=∫1−y10y21e−y3dy2=(1−y1)y23e−y3, 0<y1<1,0<y3<∞
其他地方为零。因此Y1,Y3是独立的。同样可得Y2,Y3是独立的。因为Y1,Y2的联合pdf为
g12(y1,y2)=∫∞0y23e−y3dy3=2, 0<y1,0<y2,y1+y2<1
其他地方为零,Y1,Y2是独立的。
接下来我们考虑变换变量时遇到的其他问题。令X满足柯西pdf
f(x)=1π(1+x2), −∞<x<∞
并令Y=X2,我们现在要找Y的pdfg(y),考虑变换y=x2,这个变换将X的空间S={x:−∞<x<∞}映射到T={y:0≤y<∞}。然而变换不是一对一的,对于每个y∈T(除了y=0),他们对应两个点x∈S。例如,如果y=4,那么要么x=2要么x=−2。对于这样的例子,我们将S表示成两个不相交集合A1,A2的并,使得y=x2为将A1,A2映射到T上的一对一变换。如果取A1为{x:−∞<x<0},A2为{x:0≤x<∞},可以看出A1被映射到{y:0<y<∞},A2被映射到{x:0≤y<∞},这些集合是不同的。困难在于x=0是S中的元素,那么我们为何不回到柯西pdf取f(0)=0呢?这样的话我们的S={−∞<x<∞,x≠0},就可以取A1={x:−∞<x<0},A2={x:0<x<∞},那么逆变换为x=−y√的y=x2将A1映射到T={x:0<x<∞},变换是一对一的。进一步,逆变换为x=y√的y=x2将A2映射到T={y:0<y<∞},变换是一对一的。考虑概率P(Y∈B),其中B⊂T,令A3={x:x=−y√,y∈B}⊂A1,A4={x:x=y√,y∈B}⊂A2,那么当且仅当X∈A3或者X∈A4时Y∈B,所以我们有
P(Y∈B)=P(X∈A3)+P(X∈A4)=∫A3f(x)dx+∫A4f(x)dx
对第一个积分,令x=−y√,那么雅克比J1为−1/2y√;进一步,集合A3被映射到B上。对第二个积分,令x=y√,那么雅克比J2为1/2y√;进一步,集合A4也别映射到B上。最终
P(Y∈B)=∫Bf(−y√)∣∣∣−12y√∣∣∣dy+∫Bf(y√)1y√dy=∫B[f(−y√)+f(y√)]12y√dy
Y的pdf为
g(y)=12y√[f(−y√)+f(y√)], y∈T
因为f(x)是柯西pdf,所以我们有
g(y)={1π(1+y)y√00<y<∞elsewhere
前面这些连续型随机变量的讨论中,我们有两个逆函数x=−y√,x=y√,这也是为什么我们要将S分成两个不相交的子集,从而使得变换y=x2 将每个集合映射到T上。如果有三个逆函数,我们可以将S分成三个不相交的集合,等等。
令h(x1,x2,…,xn)是连续型随机变量X1,X2,…,Xn的联合pdf,令S表示h(x1,x2,…,xn)>0的n维空间并考虑变换y1=u1(x1,x2,…,xn),…,yn=un(x1,x2,…,xn),将S映射到T。对于S 中的每个点只对应T中的一个点;但是T中的一个点可能对应S中的多个点,即变换不是一对一的。然而假设我们能用有限个互不相交的集合A1,A2,…,Ak并表示S,使得
y1=u1(x1,x2,…,xn),…,yn=un(x1,x2,…,xn)
是Ai到T的一对一变换,那么T 中的每个点只对应A1,A2,…,Ak中的一个点。对i=1,…,k,令
x1=w1i(y1,y2,…,yn),x2=w2i(y1,y2,…,yn),…,xn=wni(y1,y2,…,yn)
表示k组n个逆函数。令一阶偏导连续且每个
Ji=∣∣∣∣∣∣∣∣∣∣∣∂w1i∂y1∂w2i∂y1⋮∂wni∂y1∂w1i∂y2∂w2i∂y2⋮∂wni∂y2⋯⋯⋯∂w1i∂yn∂w2i∂yn⋮∂wni∂yn∣∣∣∣∣∣∣∣∣∣∣, i=1,2,…,k
不等于T中的零。考虑k个互斥事件并的概率以及变量变换方法,可以看出Y1=u1(X1,X2,…,Xn),Y2=u2(X1,X2,…,Xn),…,Yn=un(X1,X2,…,Xn) 的联合pdf为
g(y1,y2,…,yn)=∑i=1k|Ji|h[w1i(y1,…,yn),…,wni(y1,…,yn)]
其他地方为零,这里假设(y1,y2,…,yn)∈T。任何Yi的pdf,假设为Y1是
g1(y1)=∫∞−∞⋯∫∞−∞g(y1,y2,…,yn)dy2⋯dyn
例3:令X1,X2的联合pdf定义在单位圆上
f(x1,x2)={1π00<x21+x22<1elsewhere
令Y1=X21+X22,Y2=X21/(X21+X22),那么y1y2=x21,x22=y1(1−y2),支撑S映射到T={(y1,y2):0<yi<1,i=1,2}。对每个有序数对(y1,y2)∈T,在S中有四个点
(x1,x2)使得x1=y1y2−−−−√,x2=y1(1−y2)−−−−−−−−√(x1,x2)使得x1=y1y2−−−−√,x2=−y1(1−y2)−−−−−−−−√(x1,x2)使得x1=−y1y2−−−−√,x2=y1(1−y2)−−−−−−−−√(x1,x2)使得x1=−y1y2−−−−√,x2=−y1(1−y2)−−−−−−−−√
第一个雅克比为
J1=∣∣∣∣∣12y2/y1−−−−−√12(1−y2)/y1−−−−−−−−−√12y1/y2−−−−−√−12y1/(1−y2)−−−−−−−−−√∣∣∣∣∣=14⎧⎩⎨−1−y2y2−−−−−−√−y21−y2−−−−−−√⎫⎭⎬=−141y2(1−y2)−−−−−−−−√
很容易看出这四个雅克比的绝对值都等于1/4y2(1−y2)−−−−−−−−√。因此Y1,Y2的联合pdf是这四项的和,可写成
g(y1,y2)=41π14y2(1−y2)−−−−−−−−√=1πy2(1−y2)−−−−−−−−√,(y1,y2)∈T
所以Y1,Y2是独立的随机变量。
当然与二元情况一样,注意到如果Y=g(X1,X2,…,Xn)是随机变量的函数,我们可以使用mgf方法,连续情况Y的mgf为
E(etY)=∫∞−∞∫∞−∞⋯∫∞−∞etg(x1,x2,…,xn)h(x1,x2,…,xn)dx1dx2⋯dxn
其中h(x1,x2,…,xn)是联合pdf。对于离散情况,只需要用求和符号代替积分即可,这个过程在处理独立随机变量的线性函数是非常有用。
例4:令X1,X2,X3是独立的随机变量,联合pmf为
p(x1,x2,x3)={μx11μx22μx33e−μ1−μ2−μ3x1!x2!x3!0xi=0,1,2,…,i=1,2,3elsewhere
如果Y=X1+X2+X3,那么Y的mgf为
E(etY)=E(et(X1+X2+X3))=E(etX1etX2etX3)=E(etX1)E(etX2)E(etX3)
因为X1,X2,X3是独立的,且之前的例子中已求出
E(etXi)=exp{μi(et−1)},i=1,2,3
因此
E(etY)=exp{(μ1+μ2+μ3)(et−1)}
然而这时pmf
pY(y)={μ1+μ2+μ3ye−(μ1+μ2μ3)y!0y=0,1,2,…elsewhere
所以这就是Y=X1+X2+X3的分布。
例5:令X1,X2,X3,X4是独立的随机变量且共同的pdf为
f(x)={e−x0x>0elsewhere
如果Y=X1+X2+X3+X4,那么与上例一样,X1,X2,X3,X4独立就意味着
E(etY)=E(etX1)E(etX2)E(etX3)E(etX4)
之前我们求出
E(etXi)=(1−t)−1,t<1,i=1,2,3,4
因此
E(etY)=(1−t)−4
随后我们会看到这就是pdf为
fY(y)={13!y3e−y00<y<∞elsewhere
分布的mgf,因此这就是Y的分布。