第四章随机变量的数字特征
随机变量的概率分布反映了随机变量的统计规律性,但在实际问题中,要确定一个随机变量的分布不是件容易的事情。在许多情况下,并不需要求出随机变量的分布,只需知道从不同角度反应随机变量取值的特征的若干个数字就够了,这些数字就称为随机变量的数字特征。
本章将讨论随机变量的数学期望、方差、矩以及相关系数,它们在概率论与数理统计中起着重要的作用。
§4.1数学期望
一、离散型随机变量的数学期望
例1.一台机床加工某种零件,已知它加工出优质品、合格品和废品的概率依次为0.2,0.7和0.1.如果出售优质品和合格品,每一个零件可分别获利0.40元和0.20元;如果加工出来一件废品则要损失0.10元.问这台机床每加工出一个零件,平均可获利多少元?
解:
现假设该机床加工n个零件,其中废品n 1 件,合格品n 2 件,优质品n 3 件,这里n 1 +n 2 +n 3 =n.则这n个零件可获得总利润为:−0.1n 1 +0.2n 2 +0.4n 3 ,平均每个零件可获利为:−0.1×n 1 n +0.2×n 2 n +0.4×n 3 n 其中n 1 n ,n 2 n 和n 3 n 分别是事件{X=−0.10}、{X=0.20}和{X=0.40}出现的频率.当n很大时,n 1 n ,n 2 n 和n 3 n 分别接近与0.1,0.7,0.2,于是可以期望该机床加工出的每一个零件所获得的平均利润为:−0.1×0.1+0.2×0.7+0.4×0.2=0.21(元)上述结果称为随机变量X的数学期望.
定义1.设离散型随机变量X的分布律为
XY x 1 p 1 x 2 p 2 ⋯⋯ x k p k ⋯⋯
则称
E(X)=∑ k=1 ∞ x k p k (要求此级数绝对收敛)(1)为X的数学期望(或均值).
例2.设X服从参数为p的(0−1)分布,求X的数学期望.
解:X的分布律为
XY 01−p 1p
E(X)=0×(1−p)+1×p=p.
例3.设X∼B(n,p),求E(X).
解:X的分布律为:p k =P{X=k}=C k n p k (1−p) n−k ,k=0,1,2,⋯,nE(X)=∑ k=0 n kp k =∑ k=1 n kn!k!(n−k)! p k (1−p) n−k =np∑ k=1 n C k−1 n−1 p k−1 (1−p) (n−1)−(k−1) =np(p+1−p) n−1 =np
例4.设X∼π(λ),求E(X).
解:p k =P{X=k}=λ k k! e −λ ,k=0,1,2,⋯E(X)=∑ k=0 ∞ kp k =∑ k=1 ∞ kλ k k! e −λ =λe −λ ∑ k=1 ∞ λ k−1 (k−1)! =λe −λ e λ =λ
例5.已知10件产品中有2件次品,求任取3件中次品数的数学期望.
解:以X表示任取3件中次品的个数,可取值为0,1,2,其分布律为:P{X=0}=(83)(103) =715 ,P{X=1}=(82)(21)(103) =715 ,P{X=2}=(82)(22)(103) =115 ,因此E(X)=0×715 +1×715 +2×115 =35
二、连续型随机变量的数学期望
定义2.设连续型随机变量X的概率密度为f(x),则称E(X)=∫ +∞ −∞ xf(x)dx(要求此积分绝对收敛)(2)为X的数学期望(或均值).
例6.设X在[a,b]上服从均匀分布,求E(X).
解:X的概率密度为
f(x)=⎧ ⎩ ⎨ 1b−a ,a≤x<b,0,其它
E(X)=∫ +∞ −∞ xf(x)dx=∫ b a x1b−a dx=a+b2
例7.设X服从参数为λ的指数分布,求E(X).
解:X的密度函数为
f(x)={λe −λx ,x≥0,0,其它.
E(X)=∫ +∞ −∞ xf(x)dx=∫ +∞ 0 xλe −λx dx=1λ
例8.设X∼N(μ,σ 2 ),求E(X).
解:f(x)=12π − − √ σ e −(x−μ) 2 2σ 2 ,−∞<x<+∞
E(X)=∫ +∞ −∞ xf(x)dx=∫ +∞ −∞ x2π − − √ σ e −(x−μ) 2 2σ 2 dx= 令x−μσ =t 12π − − √ ∫ +∞ −∞ (σt+μ)e −t 2 2 dt=σ2π − − √ ∫ +∞ −∞ te −t 2 2 dt+μ∫ +∞ −∞ 12π − − √ e −t 2 2 dt=μ
三、随机变量的函数的数学期望
定理1.设随机变量Y是随机变量X的函数:Y=g(X);(1)若X为离散型,且分布律为p k =P{X=x k },k=1,2,⋯则E(Y)=E[g(X)]=∑ k=1 ∞ g(x k )p k (3)(2)若X为连续型,其密度为f(x),则E(Y)=E[g(X)]=∫ +∞ −∞ g(x)f(x)dx(4)
例9.设X的分布律为
XP −21/6 −11/3 01/4 1/21/12 11/6
求E(X 2 ),E(aX+b).
解:E(X 2 )=(−2) 2 ×16 +(−1) 2 ×13 +0 2 ×14 +(12 ) 2 ×112 +1 2 ×16 =1916 E(aX+b)=(−2a+b)×16 +(−a+b)×13 +b×14 +(12 a+b)×112 +(a+b)×16 =1124 a+b
例10.设X∼N(0,1),求E(X 2 ).
解:E(X 2 )=∫ +∞ −∞ x 2 φ(x)dx=12π − − √ ∫ +∞ −∞ x 2 e −x 2 2 dx=1
例11.设X在区间(0,a)上服从均匀分布,求Y=kX 2 的数学期望.
解:X的密度为f(x)=⎧ ⎩ ⎨ 1a ,0<x<a,0,其它
E(Y)=E(kX 2 )=∫ +∞ −∞ kx 2 f(x)dx=∫ a 0 kx 2 1a dx=13 ka 2
例12.设X的概率密度为
f(x)=⎧ ⎩ ⎨ 12 cosx,−π2 <x<π2 ,0,其它
Y=sinX,Z=cosX,求E(Y),E(Z).
解:E(Y)=E(sinx)=∫ +∞ −∞ sinxf(x)dx=∫ +π2 −π2 sinx12 cosxdx=0
E(Z)=E(cosX)=∫ +∞ −∞ cosxf(x)dx=∫ +π2 −π2 cosx12 cosxdx=∫ π2 0 1+cos2x2 dx=π4
定理2.设随机变量Z是X、Y的函数Z=g(x,y);(1)若(X,Y)为二维连续型随机变量,联合密度为f(x,y),则E(Z)=E[g(X,Y)]=∫ +∞ −∞ ∫ +∞ −∞ g(x,y)f(x,y)dxdy(5)(2)若(X,Y)为二维离散型随机变量,联合分布律为:p ij =P{X=x i ,Y=y j },i,j=1,2,⋯则E(Z)=E[g(X,Y)]=∑ j=1 ∞ ∑ i=1 ∞ g(x i ,y i )p ij
例13.设(X,Y)的联合密度为
f(x,y)={x+y,0≤x≤1,0≤y≤1,0,其它
求E(X),E(XY).
解:E(X)=∫ +∞ −∞ ∫ +∞ −∞ xf(x,y)dxdy=∫ 1 0 dx∫ 1 0 x(x+y)dy=712 E(XY)=∫ +∞ −∞ ∫ +∞ −∞ xyf(x,y)dxdy=∫ 1 0 dx∫ 1 0 xy(x+y)dy=13
四、数学期望的性质(设E(X)、E(Y)存在)
性质1.设C为常数,则有E(C)=C.
性质2.E(C⋅X)=C⋅E(X).
性质3.E(X±Y)=E(X)±E(Y).
证:只对连续型随机变量的情形来证明:E(X+Y)=E(X)+E(Y),离散型的证明从略.
设(X,Y)的概率密度为f(x,y),则有E(X+Y)=∫ +∞ −∞ ∫ +∞ −∞ (x+y)f(x,y)dxdy=∫ +∞ −∞ ∫ +∞ −∞ xf(x,y)dxdy+∫ +∞ −∞ ∫ +∞ −∞ yf(x,y)dxdy=E(X)+E(Y)
性质4.若X、Y相互独立,则E(XY)=E(X)E(Y).
证:只对连续型加以证明.设(X,Y)的联合密度为f(x,y),关于X、Y的边缘密度分别为f X (x)、f Y (y).则有f(x,y)=f X (x)f Y (y),于是E(XY)=∫ +∞ −∞ ∫ +∞ −∞ xyf(x,y)dxdy=∫ +∞ −∞ ∫ +∞ −∞ xyf X (x)f Y (y)dxdy=∫ +∞ −∞ xf X (x)dx∫ +∞ −∞ yf Y (y)dy=E(X)E(Y)
例14.设X与Y独立,
f X (x)={2x,0<x<1,0,其它 f Y (y)={e −(y−2) ,y>2,0,其它,
求E(XY).
解:E(XY)=E(X)E(Y)=∫ +∞ −∞ xf X (x)dx∫ +∞ −∞ yf Y (y)dy=∫ 1 0 x⋅2xdx∫ +∞ 2 ye −(y−2) dy=2
思考题:是否任何一个随机变量都存在数学期望?请研究随机变量X,其概率密度为f(x)=1π 11+x 2 ,−∞<x<+∞
§4.2方差
一、方差的定义
定义3.D(X)=E{[X−E(X)] 2 }(6)称为随机变量X的方差,称D(X) − − − − − √ 为X的均方差或标准差.
二、方差的计算公式
1.设X为离散型随机变量,分布律为
XP x 1 p 1 x 2 p 2 ⋯⋯ x k p k ⋯⋯
则D(X)=∑ k=1 ∞ [x k −E(X)] 2 p k (7)
2.设X为连续型随机变量,概率密度为f(x),则D(X)=∫ +∞ −∞ [x−E(X)] 2 f(x)dx(8)
3.D(X)=E(X 2 )−[E(X)] 2 (9)
证明:D(X)=E[X−E(X)] 2 =E{X 2 −2XE(X)+[E(X)] 2 }=E(X 2 )−E[2XE(X)]+E[E(X)] 2 =E(X 2 )−2E(X)E(X)+[E(X)] 2 =E(X 2 )−[E(X)] 2
例1.设X服从参数p的(0−1)分布,求D(X).
解XP 01−p 1p ,E(X)=p.
E(X 2 )=0 2 ×(1−p)+1 2 ×p=p,D(X)=E(X 2 )−[E(X)] 2 =p−p 2 =p(1−p)
例2.设X∼π(λ),求D(X).
解:p k =P{X=k}=λ k k! e −λ ,k=1,2,⋯,E(X)=λ,E(X 2 )=E[X(X−1)+X]=E[X(X−1)]+E(X),E[X(X−1)]=∑ k=0 ∞ k(k−1)λ k e −λ k! =λ 2 e −λ ∑ k=2 ∞ λ k−2 (k−2)! =λ 2 e −λ e λ =λ 2 E(X 2 )=λ 2 +λ,D(X)=E(X 2 )−[E(X)] 2 =λ 2 +λ−λ 2 =λ
例3设X在区间(a,b)上服从均匀分布,求D(X)
解:E(X)=a+b2 D(X)=E(X 2 )−[E(X)] 2 =∫ +∞ −∞ x 2 f(x)dx−(a+b2 ) 2 =∫ b a x 2 b−a dx−(a+b2 ) 2 =a 2 +ab+b 2 3 −(a+b2 ) 2 =(b−a) 2 12
例4.设X服从参数为λ的指数分布,求D(X).
解:f(x)={λe −λx ,x>00,x≤0
E(X)=1λ
D(X)=E(X 2 )−(E(X)] 2 =∫ +∞ −∞ x 2 f(x)dx−(E(X)] 2 =∫ +∞ 0 x 2 λe −λx dx−1λ 2 =21λ 2 −1λ 2 =1λ 2
例5.设X∼N(μ,σ 2 ),求D(X).
解:D(X)=E{[X−E(X)] 2 }=∫ +∞ −∞ (x−μ) 2 12π − − √ σ e −(x−μ) 2 2σ 2 dx= t=x−μσ ∫ +∞ −∞ t 2 σ 2 12π − − √ σ e −t 2 2 σdt=σ 2
三、方差的性质
性质1.设C为常数,则D(C)=0.
证:D(C)=E[C−E(C)] 2 =E[C−C] 2 =E(0)=0
性质2.D(CX)=C 2 D(X).
证:D(CX)=E[CX−E(CX)] 2 =E{C 2 [X−E(X)] 2 }=C 2 D(X).
性质3.设X与Y相互独立,则有:D(X±Y)=D(X)+D(Y)
证:D(X±Y)=E{[(X±Y)−E(X±Y)] 2 }=E{[X−E(X)]±[Y−E(Y)]} 2 =E{[X−E(X)] 2 ±2[X−E(X)][Y−E(Y)]+[Y−E(Y)] 2 }=E[X−E(X)] 2 +E[Y−E(Y)] 2 ±2E{[X−E(X)][Y−E(Y)]}=D(X)+D(Y)±2[E(X)−E(X)][E(Y)−E(Y)]=D(X)+D(Y)
例6.设X∼B(n,p),求D(X).
解:设X i 服从参数为p的(0−1)分布,且X 1 ,X 2 ,⋯,X n 相互独立,则X=X 1 +X 2 +⋯+X n ∼B(n,p).于是D(X)=D(∑ i=1 n X i )=∑ i=1 n D(X i )=∑ i=1 n p(1−p)=np(1−p)
例7.设X与Y相互独立,D(X)=2,Y∼B(10,0.2),求D(3X−5Y).
解:D(3X−5Y)=D(3X)+D(5Y)=3 2 D(X)+5 2 D(Y)=9×2+25×10×0.2×0.8=58
例8.设E(X)、D(X)均存在,且D(X)>0,X ∗ =X−E(X)D(X) − − − − − √ ,求E(X ∗ ),D(X ∗ ).
解:E(X ∗ )=E(X−E(X)D(X) − − − − − √ )=1D(X) − − − − − √ E[X−E(X)]=1D(X) − − − − − √ [E(X)−E(X)]=0D(X ∗ )=D(X−E(X)D(X) − − − − − √ )=1D(X) D[X−E(X)]=1D(X) [D(X)−D(E(X))]=1称X ∗ =X−E(X)D(X) − − − − − √ 为X的标准化随机变量.
例9.设X 1 ,X 2 ,⋯,X n 相互独立,并且具有相同的期望μ与方差σ 2 ,X ¯ =1n ∑ i=1 n X i ,求E(X ¯ ),D(X ¯ ),X ¯ ∗ .
解:E(X ¯ )=E(1n ∑ i=1 n X i )=1n ∑ i=1 n E(X i )=1n ∑ i=1 n μ=μD(X ¯ )=D(1n ∑ i=1 n X i )=1n 2 ∑ i=1 n D(X i )=1n 2 ∑ i=1 n σ 2 =σ 2 n X ¯ ∗ =X ¯ −E(X ¯ )DX ¯ − − − √ =X ¯ −μσ n √
§4.3协方差与相关系数
定义4.称E{[X−E(X)][Y−E(Y)]}为X与Y的协方差,记作Cov(X,Y)=E{[X−E(X)][Y−E(Y)]}.(10)称ρ XY =Cov(X,Y)D(X) − − − − − √ D(Y) − − − − − √ (11)为X与Y的相关系数或标准协方差.
Cov(X,Y)=E(XY)−E(X)E(Y)(12)
D(X±Y)=D(X)+D(Y)±2Cov(X,Y)
性质1:Cov(X,Y)=Cov(Y,X).Cov(aX,bY)=abCov(X,Y).(a,b为常数)Cov(X 1 +X 2 ,Y)=Cov(X 1 ,Y)+Cov(X 2 ,Y)
性质2:|ρ XY |≤1,|Cov(X,Y)≤D(X)D(Y) − − − − − − − − − √
性质3:若X与Y相互独立,则Cov(X,Y)=0,ρ XY =0
性质4:|ρ XY |=1的充分必要条件是:存在常数a,b,使得P{Y=aX+b}=1当ρ XY =0时,称X与Y不相关.
例1.设二维随机变量(X,Y)的概率分布为:
X−101 Y −11/81/81/8 01/801/8 11/81/81/8
证明X与Y不相关,但X与Y不相互独立.
证:(X,Y)关于X与Y的边缘分布为
XP −13/8 02/8 13/8
YP −13/8 02/8 13/8
E(X)=−1×38 +0×28 +1×38 =0=E(Y)E(XY)=∑ i,j x i y j p ij =0于是有Cov(X,Y)=E(XY)−E(X)E(Y)=0因此ρ XY =0,即X与Y不相干.
由于P{X=−1,Y=−1}=18 ,P{X=−1}P{Y=−1}=38 ×38 =964 ,即有P{X=−1,Y=−1}≠P{X=−1}P{Y=−1},所以X与Y不相互独立.
例2.设(X,Y)的联合概率密度为
f(x,y)=⎧ ⎩ ⎨ 1π ,x 2 +y 2 ≤1,0,其它
验证X与Y不相关,但不相互独立.
解:D:x 2 +y 2 ≤1E(X)=∫ +∞ −∞ ∫ +∞ −∞ xf(x,y)dxdy=∬ D xf(x,y)dxdy=1π ∬ D xdxdy=1π ∫ 2π 0 dθ∫ 1 0 r 2 cosθdr=0同理E(Y)=0,E(XY)=0,于是Cov(X,Y)=E(XY)−E(X)E(Y)=0从而有ρ XY =0,即X与Y不相关.
f X (x)=∫ +∞ −∞ f(x,y)dy=⎧ ⎩ ⎨ 2π 1−x 2 − − − − − √ ,|x|≤1,0,其它
f Y (y)=∫ +∞ −∞ f(x,y)dx=⎧ ⎩ ⎨ 2π 1−y 2 − − − − − √ ,|y|≤10,其它
当x=0,y=0时,f X (0)f Y (0)=4π 2 ,而f(0,0)=1π ,既有f(0,0)≠f X (0)f Y (0),所以X与Y不相互独立.
例3.设二维随机变量(X,Y)的概率密度为
f(x,y)={1,|y|<x,0<x<1,0,其它
证明:X与Y不相关,但不相互独立.
证:E(X)=∫ +∞ −∞ ∫ +∞ −∞ xf(x,y)dxdy=∫ 1 0 dx∫ x −x x⋅1dy=23 ,E(Y)=∫ +∞ −∞ ∫ +∞ −∞ yf(x,y)dxdy=∫ 1 0 dx∫ x −x ydy=0,E(XY)=∫ +∞ −∞ ∫ +∞ −∞ xyf(x,y)dxdy=∫ 1 0 dx∫ x −x xydy=0从而有Cov(X,Y)=0,ρ XY =0,即X与Y不相关.
由于
f X (x)=∫ +∞ −∞ f(x,y)dy={2x,0<x<1,0,其它
f Y (y)=∫ +∞ −∞ f(x,y)dx=⎧ ⎩ ⎨ ⎪ ⎪ 1+y,−1<y<0,1−y,0≤y<1,0,其它
而f(12 ,14 )=1,f X (12 )=1,f Y (14 )=34 ,可见f(12 ,14 )≠f X (12 )f Y (14 ),所以X和Y不相互独立.
例4.设(X,Y)∼N(μ 1 ,μ 2 ,σ 2 1 ,σ 2 2 ,ρ),即(X,Y)的联合密度为
f(x,y)=12πσ 1 σ 2 1−ρ 2 − − − − − √ exp{−12(1−ρ 2 ) [(x−μ 1 ) 2 σ 2 1 −2ρ(x−μ 1 )(y−μ 2 )σ 1 σ 2 +(y−μ 2 ) 2 σ 2 2 ]}
求ρ XY .
解:由于X∼N(μ 1 ,σ 2 1 ),Y∼N(μ 2 ,σ 2 2 ),而Cov(X,Y)=E{[X−E(X)][Y−E(Y)]}=∫ +∞ −∞ ∫ +∞ −∞ (x−μ 1 )(y−μ 2 )f(x,y)dxdy=ρσ 1 σ 2 因此,ρ(X,Y)=Cov(X,Y)D(X)D(Y) − − − − − − − − − √ =ρ
§4.4矩
定义5.设X与Y是两个随机变量,称E(X k )为X的k阶原点矩;称E{[E−E(X)] k }为X的k阶中心矩;称E(X k Y l )为X与Y的k+l阶混合原点矩;称E{[X−E(X)] k [Y−E(Y)] l }为X与Y的k+l阶混合中心矩.
随机变量X的标准化随机变量X ∗ =X−E(X)D(X) − − − − − √ 的3阶原点矩E(X ∗3 )=E[X−E(X)D(X) − − − − − √ ] 3 =E[X−E(X)] 3 [D(X)] 32 称为X的偏度;X ∗ 的4阶原点矩E(X ∗4 )=E[X−E(X)D(X) − − − − − √ ] 4 =E[X−E(X)] 4 [D(X)] 2 称为X的峰度.