文章目录
概率论
第一章 随机事件和概率
第一节 事件的关系和运算
A
⊂
B
⇒
A
−
B
=
A
B
ˉ
=
∅
A\subset B \Rightarrow A-B=A\bar{B} =\varnothing
A⊂B⇒A−B=ABˉ=∅
对偶率:
∩
i
=
1
n
A
i
‾
=
∪
i
=
1
n
A
i
‾
,
∪
i
=
1
n
A
i
‾
=
∩
i
=
1
n
A
i
‾
\overline{\mathop{\cap}\limits_{i=1}^{n} A_i}= \mathop{\cup }\limits_{i=1}^{n} \overline{A_i},\overline{\mathop{\cup}\limits_{i=1}^{n} A_i}= \mathop{\cap }\limits_{i=1}^{n} \overline{A_i}
i=1∩nAi=i=1∪nAi,i=1∪nAi=i=1∩nAi
第二节 概率及公式
条件概率
P ( B ∣ A ) = P ( A B ) P ( A ) P(B|A)=\cfrac{P(AB)}{P(A)} P(B∣A)=P(A)P(AB)
独立
P ( A B ) = P ( A ) P ( B ) 即 P ( A ∣ B ) = P ( A ∣ B ˉ ) P(AB)=P(A)P(B) 即 P(A|B)=P(A|\bar{B}) P(AB)=P(A)P(B)即P(A∣B)=P(A∣Bˉ)
容斥
P
(
A
∪
B
)
=
P
(
A
)
+
P
(
B
)
−
P
(
A
B
)
P(A\cup B)= P(A)+P(B)-P(AB)
P(A∪B)=P(A)+P(B)−P(AB)
P
(
A
∪
B
∪
C
)
=
P
(
A
)
+
P
(
B
)
+
P
(
C
)
−
P
(
A
B
)
−
P
(
A
C
)
−
P
(
B
C
)
+
P
(
A
B
C
)
P(A\cup B\cup C)=P(A)+P(B)+P(C)-P(AB)-P(AC)-P(BC)+P(ABC)
P(A∪B∪C)=P(A)+P(B)+P(C)−P(AB)−P(AC)−P(BC)+P(ABC)
乘法
P
(
A
B
)
=
P
(
A
)
P
(
B
∣
A
)
P(AB)=P(A)P(B|A)
P(AB)=P(A)P(B∣A)
P
(
A
1
A
2
A
n
)
=
P
(
A
1
)
P
(
A
2
∣
A
1
)
…
P
(
A
n
∣
A
1
A
2
…
A
n
−
1
)
P(A_1A_2A_n)=P(A_1)P(A_2|A_1)\dots P(A_n|A_1A_2\dots A_{n-1})
P(A1A2An)=P(A1)P(A2∣A1)…P(An∣A1A2…An−1)
全概率公式
P ( A ) = ∑ i = 1 n P ( B i ) P ( A ∣ B i ) P(A)=\displaystyle \sum\limits_{i=1}^n P(B_i)P(A|B_i) P(A)=i=1∑nP(Bi)P(A∣Bi)
贝叶斯公式
P ( B k ∣ A ) = P ( B k ) P ( A ∣ B k ) ∑ i = 1 n P ( B i ) P ( A ∣ B i ) P(B_k|A)=\displaystyle \frac{P(B_k)P(A|B_k)}{\sum\limits_{i=1}^n P(B_i)P(A|B_i)} P(Bk∣A)=i=1∑nP(Bi)P(A∣Bi)P(Bk)P(A∣Bk)
古典概型和伯努利
P ( A ) = n A n = A 所包含的样点 样本点总数 P(A)=\cfrac{n_A}{n}=\cfrac{A所包含的样点}{样本点总数} P(A)=nnA=样本点总数A所包含的样点
只有 A , A ‾ A,\overline{A} A,A ,称为伯努利试验,重复 n n n次则为n重伯努利实验, P ( A ) = p P(A)=p P(A)=p ,发生k次的概率为 P = C n k p k ( 1 − p ) n − k P=C_n^kp^k(1-p)^{n-k} P=Cnkpk(1−p)n−k
补充
C n + 1 k = C n k + C n k − 1 C_{n+1}^k=C_n^k+C_n^{k-1} Cn+1k=Cnk+Cnk−1
n+1个数选k个 =当前数不选(后面选k-1)+当前数选(后面选k)
C n + m k = ∑ i = 1 k C n i ∗ C m k − i C_{n+m}^k=\displaystyle \sum \limits _{i=1}^kC_n^i*C_m^{k-i} Cn+mk=i=1∑kCni∗Cmk−i
n+m个数中选k个=从n个数中选i个*从m个数中选k-i个
第二章 随机变量及其概率分布
第一节 随机变量及其分布函数
F ( x ) = P ( X ≤ x ) F(x)=P(X \leq x) F(x)=P(X≤x)
如果存在一个非负可积函数 f ( x ) f(x) f(x),使得任意 x x x,都有 F ( x ) = ∫ − ∞ x f ( t ) d t , − ∞ < x < + ∞ F(x)=\int^x_{-\infty}f(t)\mathrm{d}t ,-\infty<x<+\infty F(x)=∫−∞xf(t)dt,−∞<x<+∞,则称X为连续随机变量f(x)为概率密度函数
第二节 常用分布
0 − 1 0-1 0−1分布
E ( X ) = p , D ( X ) = p ( 1 − p ) E(X)=p,D(X)=p(1-p) E(X)=p,D(X)=p(1−p)
二项分布(伯努利
X
∼
B
(
n
,
p
)
X\sim B(n,p)
X∼B(n,p)
P
(
X
=
k
)
=
C
n
k
p
k
(
1
−
p
)
n
−
k
P(X=k)=C_n^kp^k(1-p)^{n-k}
P(X=k)=Cnkpk(1−p)n−k
E
(
X
)
=
n
p
,
D
(
X
)
=
n
p
(
1
−
p
)
E(X)=np,D(X)=np(1-p)
E(X)=np,D(X)=np(1−p)
超几何分布
P ( X = k ) = C N k C M n − k C N + M n P(X=k)=\cfrac{C_N^kC_M^{n-k}}{C_{N+M}^n} P(X=k)=CN+MnCNkCMn−k
几何分布
P
(
X
=
k
)
=
(
1
−
p
)
k
−
1
p
P(X=k)=(1-p)^{k-1}p
P(X=k)=(1−p)k−1p
E
(
X
)
=
1
p
,
D
(
X
)
=
1
−
p
p
2
E(X)=\cfrac{1}{p},D(X)=\cfrac{1-p}{p^2}
E(X)=p1,D(X)=p21−p
泊松分布
X
∼
P
(
λ
)
,
λ
>
0
X\sim P(\lambda),\lambda>0
X∼P(λ),λ>0
P
(
X
=
k
)
=
λ
k
k
!
e
−
λ
,
k
=
0
,
1
,
2
,
3
,
.
.
P(X=k)=\cfrac{\lambda^k}{k!}e^{-\lambda},k=0,1,2,3,..
P(X=k)=k!λke−λ,k=0,1,2,3,..
E
(
X
)
=
λ
,
D
(
X
)
=
λ
E(X)=\lambda,D(X)=\lambda
E(X)=λ,D(X)=λ
泊松定理:伯努利实验中
p
n
p_n
pn代表A在一次实验中出现的概率,它与实验总数
n
n
n有关,随着
n
n
n的增大,
p
n
p_n
pn在减小,如果
lim
n
→
∞
n
p
n
=
λ
⇒
lim
n
→
∞
C
n
k
p
k
(
1
−
p
)
n
−
k
=
λ
k
k
!
e
−
λ
\lim\limits_{n\rightarrow \infty}np_n=\lambda \Rightarrow\lim\limits_{n\rightarrow \infty}C_n^kp^k(1-p)^{n-k}=\cfrac{\lambda^k}{k!}e^{-\lambda}
n→∞limnpn=λ⇒n→∞limCnkpk(1−p)n−k=k!λke−λ
均匀分布
X
∼
[
a
,
b
]
或者
X
∼
(
a
,
b
)
X\sim [a,b]或者X\sim (a,b)
X∼[a,b]或者X∼(a,b)
f
(
x
)
=
{
1
b
−
a
,
a
<
x
<
b
0
,
其他
f(x)=\left\{\begin{aligned} &\cfrac{1}{b-a},&a<x<b\\ &0,&其他\\ \end{aligned}\right.
f(x)=⎩
⎨
⎧b−a1,0,a<x<b其他
F
(
x
)
=
{
0
,
b
≤
x
x
−
a
b
−
a
,
a
≤
x
<
b
1
,
b
≤
x
F(x)=\left\{\begin{aligned} &0,&b\leq x\\ &\cfrac{x-a}{b-a},&a\leq x<b\\ &1,&b\leq x\\ \end{aligned}\right.
F(x)=⎩
⎨
⎧0,b−ax−a,1,b≤xa≤x<bb≤x
E ( X ) = a + b 2 , D ( X ) = ( a − b ) 2 12 E(X)=\cfrac{a+b}{2},D(X)=\cfrac{(a-b)^2}{12} E(X)=2a+b,D(X)=12(a−b)2
E ( X ) = ∫ a b x ∗ 1 b − a d x = x 2 2 ∣ a b b − a = b 2 − a 2 2 b − a = a + b 2 E ( X 2 ) = ∫ a b x 2 ∗ 1 b − a d x = x 3 3 ∣ a b b − a = b 3 − a 3 3 b − a = a 2 + b 2 + a b 3 D ( X ) = E ( X 2 ) − E 2 ( X ) = a 2 + b 2 + a b 3 − ( a + b 2 ) 2 = ( a − b ) 2 12 \begin{aligned} E(X) &=\int_a^b x*\cfrac{1}{b-a} dx\\ &=\cfrac{\frac{x^2}{2}|^b_a }{b-a} =\cfrac{\frac{b^2-a^2}{2} }{b-a} \\ &=\cfrac{a+b}{2}\\ E(X^2) &=\int_a^b x^2*\cfrac{1}{b-a} dx\\ &=\cfrac{\frac{x^3}{3}|^b_a }{b-a} =\cfrac{\frac{b^3-a^3}{3} }{b-a} \\ &=\cfrac{a^2+b^2+ab}{3}\\ D(X) &=E(X^2)-E^2(X)\\ &=\cfrac{a^2+b^2+ab}{3}- (\cfrac{a+b}{2})^2\\ &=\cfrac{(a-b)^2}{12}\\ \end{aligned} E(X)E(X2)D(X)=∫abx∗b−a1dx=b−a2x2∣ab=b−a2b2−a2=2a+b=∫abx2∗b−a1dx=b−a3x3∣ab=b−a3b3−a3=3a2+b2+ab=E(X2)−E2(X)=3a2+b2+ab−(2a+b)2=12(a−b)2
指数分布
X
∼
E
(
λ
)
X \sim E(\lambda)
X∼E(λ)
其中
λ
>
0
\lambda >0
λ>0
f
(
x
)
=
{
λ
e
−
λ
x
,
x
>
0
0
,
x
≤
0
f(x)=\left\{\begin{aligned} &\lambda e^{-\lambda x}&,x>0\\ &0&,x \leq0\\ \end{aligned}\right.
f(x)={λe−λx0,x>0,x≤0
F
(
x
)
=
{
1
−
e
−
λ
x
,
x
>
0
0
,
x
≤
0
F(x)=\left\{\begin{aligned} &1-e^{-\lambda x}&,x>0\\ &0&,x \leq0\\ \end{aligned}\right.
F(x)={1−e−λx0,x>0,x≤0
E ( X ) = 1 λ , D ( X ) = 1 λ 2 E(X)=\cfrac{1}{\lambda},D(X)=\cfrac{1}{\lambda^2} E(X)=λ1,D(X)=λ21
E ( X ) = ∫ 0 + ∞ x ∗ λ e − λ x d x = − x e − λ x ∣ 0 + ∞ − e − λ x λ ∣ 0 + ∞ = 1 λ E ( X 2 ) = ∫ 0 + ∞ x 2 ∗ λ e − λ x d x = − x 2 e − λ x ∣ 0 + ∞ − 2 x e − λ x λ ∣ 0 + ∞ − 2 e − λ x λ 2 ∣ 0 + ∞ = 2 λ 2 D ( X ) = E ( X 2 ) − E 2 ( X ) = 2 λ 2 − 1 λ 2 = 1 λ 2 \begin{aligned} E(X) &=\int_0^{+\infty } x*\lambda e^{-\lambda x} dx\\ &=-xe^{-\lambda x}|_0^{+\infty } - \frac{e^{-\lambda x}}{\lambda }|_0^{+\infty } \\ &=\cfrac{1}{\lambda }\\ E(X^2) &=\int_0^{+\infty } x^2*\lambda e^{-\lambda x} dx\\ &=-x^2e^{-\lambda x}|_0^{+\infty }-\frac{2xe^{-\lambda x}}{\lambda }|_0^{+\infty }- \frac{2e^{-\lambda x}}{\lambda^2 }|_0^{+\infty } \\ &=\cfrac{2}{\lambda^2 }\\ D(X) &=E(X^2)-E^2(X)\\ &=\cfrac{2}{\lambda^2 }-\cfrac{1}{\lambda^2 }\\ &=\cfrac{1}{\lambda^2 }\\ \end{aligned} E(X)E(X2)D(X)=∫0+∞x∗λe−λxdx=−xe−λx∣0+∞−λe−λx∣0+∞=λ1=∫0+∞x2∗λe−λxdx=−x2e−λx∣0+∞−λ2xe−λx∣0+∞−λ22e−λx∣0+∞=λ22=E(X2)−E2(X)=λ22−λ21=λ21
正态分布
X
∼
N
(
μ
,
σ
2
)
X \sim N(\mu,\sigma^2 )
X∼N(μ,σ2)
f
(
x
)
=
1
2
π
σ
e
−
(
x
−
μ
)
2
2
σ
2
f(x)=\cfrac{1}{\sqrt{2 \pi}\sigma }e^{-\cfrac{(x-\mu)^2 }{2 \sigma^2}}
f(x)=2πσ1e−2σ2(x−μ)2
F
(
x
)
=
1
2
π
σ
∫
−
∞
x
e
−
(
t
−
μ
)
2
2
σ
2
d
t
F(x)=\cfrac{1}{\sqrt{2 \pi}\sigma }\displaystyle\int_{-\infty}^x e^{-\cfrac{(t-\mu)^2 }{2 \sigma^2}}\mathrm{d}t
F(x)=2πσ1∫−∞xe−2σ2(t−μ)2dt
E
(
X
)
=
μ
,
D
(
X
)
=
σ
2
E(X)=\mu,D(X)=\sigma^2
E(X)=μ,D(X)=σ2
F
(
x
)
=
Φ
(
x
−
μ
σ
)
F(x)=\Phi(\cfrac{x-\mu}{\sigma})
F(x)=Φ(σx−μ)
P
{
a
<
X
≤
b
}
=
Φ
(
b
−
μ
σ
)
−
Φ
(
a
−
μ
σ
)
P\{a<X\leq b\}=\Phi(\cfrac{b-\mu}{\sigma})-\Phi(\cfrac{a-\mu}{\sigma})
P{a<X≤b}=Φ(σb−μ)−Φ(σa−μ)
标准正态分布
令
μ
=
0
,
σ
=
1
\mu=0,\sigma=1
μ=0,σ=1
φ
(
x
)
=
1
2
π
e
−
x
2
2
\varphi (x)=\cfrac{1}{\sqrt{2 \pi}}e^{-\cfrac{x^2 }{2 }}
φ(x)=2π1e−2x2
Φ
(
x
)
=
1
2
π
∫
−
∞
x
e
−
t
2
2
d
t
\varPhi(x)=\cfrac{1}{\sqrt{2 \pi} }\displaystyle\int_{-\infty}^x e^{-\cfrac{t^2 }{2 }}\mathrm{d}t
Φ(x)=2π1∫−∞xe−2t2dt
E ( X ) = 0 , D ( X ) = 1 E(X)=0,D(X)=1 E(X)=0,D(X)=1
第三节 随机变量函数分布
Y
=
g
(
X
)
Y=g(X)
Y=g(X)
X为离散型随机变量则Y也为离散型随机变量
X为连续性随机变量则Y也为连续性随机变量
- 公式法
y = g ( x ) y=g(x) y=g(x)是单调函数, h ( y ) h(y) h(y)是其反函数
f Y ( y ) = { ∣ h ′ ( y ) ∣ f X ( h ( y ) ) , a < y < b 0 , 其他 f_Y(y)=\left\{\begin{aligned} &|h'(y)|f_X(h(y)),&a<y<b\\ &0,&其他\\ \end{aligned}\right. fY(y)={∣h′(y)∣fX(h(y)),0,a<y<b其他 - 定义法
F Y ( y ) = P ( Y ≤ y ) = P ( g ( X ) ≤ y ) = ∫ g ( x ) ≤ y f X ( x ) d x F_Y(y)=P(Y \leq y)=P(g(X)\leq y )=\displaystyle\int\limits _{g(x)\leq y} f_X(x)\mathrm{d}x FY(y)=P(Y≤y)=P(g(X)≤y)=g(x)≤y∫fX(x)dx
然后 f Y ( y ) = F Y ′ ( y ) f_Y(y)=F'_Y(y) fY(y)=FY′(y)
第三章 多维随机变量及其分布
第一节 二维随机变量及其分布
二维连续性随机变量
F
(
x
,
y
)
=
∫
−
∞
x
∫
−
∞
y
f
(
u
,
v
)
d
u
d
v
F(x,y)=\displaystyle \int_{-\infty}^x \int_{-\infty}^y f(u,v)\mathrm{d}u\mathrm{d}v
F(x,y)=∫−∞x∫−∞yf(u,v)dudv
F
X
(
x
)
=
F
(
x
,
+
∞
)
=
F
(
x
,
y
)
=
∫
−
∞
x
∫
−
∞
+
∞
f
(
u
,
v
)
d
u
d
v
F_X(x)=F(x,+\infty)=F(x,y)=\displaystyle \int_{-\infty}^x \int_{-\infty}^{+\infty} f(u,v)\mathrm{d}u\mathrm{d}v
FX(x)=F(x,+∞)=F(x,y)=∫−∞x∫−∞+∞f(u,v)dudv
f
X
∣
Y
(
x
∣
y
)
=
f
(
x
,
y
)
f
Y
(
y
)
,
f
Y
(
y
)
>
0
f_{X|Y}(x|y)=\cfrac{f(x,y)}{f_Y(y)},f_Y(y)>0
fX∣Y(x∣y)=fY(y)f(x,y),fY(y)>0
第二节 随机变量的独立性
定义:
X
、
Y
相互独立
⇔
任意
x
,
y
{
P
{
X
≤
x
,
Y
≤
y
}
=
P
{
X
≤
x
}
=
P
{
Y
≤
y
}
F
(
x
,
y
)
=
F
X
(
x
)
F
Y
(
y
)
X、Y相互独立 \Leftrightarrow 任意x,y\left\{\begin{aligned} &P\{X\leq x,Y\leq y\}=P\{X\leq x\}=P\{Y\leq y\}\\ &F(x,y)=F_X(x)F_Y(y)\\ \end{aligned}\right.
X、Y相互独立⇔任意x,y{P{X≤x,Y≤y}=P{X≤x}=P{Y≤y}F(x,y)=FX(x)FY(y)
离散型随机变量
X
、
Y
相互独立
⇔
P
{
X
=
x
i
,
Y
=
y
i
}
=
P
{
X
=
x
i
}
P
{
Y
=
y
i
}
即
p
i
j
=
p
i
p
j
离散型随机变量X、Y相互独立 \Leftrightarrow P\{X= x_i,Y=y_i\}=P\{X= x_i\}P\{Y=y_i\} 即p_{ij}=p_ip_j
离散型随机变量X、Y相互独立⇔P{X=xi,Y=yi}=P{X=xi}P{Y=yi}即pij=pipj
连续型随机变量
X
、
Y
相互独立
⇔
f
(
x
,
y
)
=
f
X
(
x
)
f
Y
(
y
)
连续型随机变量X、Y相互独立 \Leftrightarrow f(x,y)=f_X(x)f_Y(y)
连续型随机变量X、Y相互独立⇔f(x,y)=fX(x)fY(y)
第三节 二维均匀分布和二维正态分布
二维均匀分布
区域
G
的面积为
A
区域G的面积为A
区域G的面积为A
f
(
x
,
y
)
=
{
1
A
,
(
x
,
y
)
∈
G
0
,其他
f(x,y)=\left\{\begin{aligned} &\cfrac{1}{A}&,(x,y) \in G\\ &0&,其他\\ \end{aligned}\right.
f(x,y)=⎩
⎨
⎧A10,(x,y)∈G,其他
二维正态分布
X
∼
N
(
μ
1
,
σ
1
2
)
,
Y
∼
N
(
μ
2
,
σ
2
2
)
X \sim N(\mu_1,\sigma_1^2 ) ,Y \sim N(\mu_2,\sigma_2^2 )
X∼N(μ1,σ12),Y∼N(μ2,σ22)
(
X
,
Y
)
∼
N
(
μ
1
,
μ
2
,
σ
1
2
,
σ
2
2
,
ρ
)
(X,Y) \sim N(\mu_1,\mu_2 ,\sigma_1^2,\sigma_2^2,\rho )
(X,Y)∼N(μ1,μ2,σ12,σ22,ρ)
f
(
x
,
y
)
=
1
2
π
σ
1
σ
2
1
−
ρ
2
e
x
p
[
−
1
(
1
−
ρ
2
)
(
(
x
−
μ
1
)
2
2
σ
1
2
+
(
y
−
μ
2
)
2
2
σ
2
2
+
2
ρ
(
x
−
μ
1
)
(
y
−
μ
2
)
σ
1
σ
2
)
]
\displaystyle f(x,y)=\cfrac{1}{2\pi \sigma_1 \sigma_2\sqrt{1-\rho^2}}exp[-\cfrac{1}{(1-\rho^2)}(\cfrac{(x-\mu_1)^2 }{2 \sigma_1^2}+\cfrac{(y-\mu_2)^2 }{2 \sigma_2^2}+\cfrac{ 2\rho (x-\mu_1)(y-\mu_2)}{\sigma_1 \sigma_2})]
f(x,y)=2πσ1σ21−ρ21exp[−(1−ρ2)1(2σ12(x−μ1)2+2σ22(y−μ2)2+σ1σ22ρ(x−μ1)(y−μ2))]
e x p ( t ) 表示 e t exp(t)表示e^t exp(t)表示et
X 、 Y 相互独立 ⇔ ρ = 0 X、Y相互独立 \Leftrightarrow \rho =0 X、Y相互独立⇔ρ=0
第四节 两个随机变量函数 Z = g ( X , Y ) Z=g(X,Y) Z=g(X,Y)的分布
核心公式
F Z ( z ) = P { Z ≤ z } = P { g ( X , Y ) ≤ z } = ∬ g ( x , y ) ≤ z f ( x , y ) d x d y \begin{aligned} F_Z(z) &= P\{Z\leq z\}\\ &= P\{g(X,Y)\leq z\}\\ &=\iint \limits_{g(x,y)\leq z}f(x,y)\mathrm{d}x\mathrm{d}y\\ \end{aligned} FZ(z)=P{Z≤z}=P{g(X,Y)≤z}=g(x,y)≤z∬f(x,y)dxdy
Z = X + Y Z=X+Y Z=X+Y的分布
F
Z
(
z
)
=
∬
x
+
y
≤
z
f
(
x
,
y
)
d
x
d
y
=
∫
−
∞
+
∞
d
x
∫
−
∞
z
−
x
f
(
x
,
y
)
d
y
=
∫
−
∞
+
∞
d
y
∫
−
∞
z
−
y
f
(
x
,
y
)
d
x
f
Z
(
z
)
=
∫
−
∞
+
∞
f
(
x
,
z
−
x
)
d
x
=
∫
−
∞
+
∞
f
(
z
−
y
,
y
)
d
y
\begin{aligned} F_Z(z) &=\iint \limits_{x+y\leq z}f(x,y)\mathrm{d}x\mathrm{d}y\\ &= \int_{-\infty}^{+\infty}\mathrm{d}x \int_{-\infty}^{z-x} f(x,y)\mathrm{d}y =\int_{-\infty}^{+\infty}\mathrm{d}y \int_{-\infty}^{z-y} f(x,y)\mathrm{d}x \\ f_Z(z) &=\int_{-\infty}^{+\infty} f(x,z-x)\mathrm{d}x=\int_{-\infty}^{+\infty} f(z-y,y)\mathrm{d}y \\ \end{aligned}
FZ(z)fZ(z)=x+y≤z∬f(x,y)dxdy=∫−∞+∞dx∫−∞z−xf(x,y)dy=∫−∞+∞dy∫−∞z−yf(x,y)dx=∫−∞+∞f(x,z−x)dx=∫−∞+∞f(z−y,y)dy
当
X
X
X和
Y
Y
Y相互独立时
f
Z
(
z
)
=
∫
−
∞
+
∞
f
X
(
x
)
f
Y
(
z
−
x
)
d
x
=
∫
−
∞
+
∞
f
X
(
z
−
y
)
f
Y
(
y
)
d
y
\displaystyle f_Z(z)=\int_{-\infty}^{+\infty} f_X(x)f_Y(z-x)\mathrm{d}x=\int_{-\infty}^{+\infty} f_X(z-y)f_Y(y)\mathrm{d}y
fZ(z)=∫−∞+∞fX(x)fY(z−x)dx=∫−∞+∞fX(z−y)fY(y)dy
称为卷积公式,记为
f
Z
=
f
X
∗
f
Y
f_Z=f_X \ast f_Y
fZ=fX∗fY
Z = max ( X , Y ) , min ( X , Y ) Z=\max(X,Y),\min(X,Y) Z=max(X,Y),min(X,Y)的计算
Z
=
max
(
X
,
Y
)
≤
z
⇒
X
≤
z
⋂
Y
≤
z
Z=\max(X,Y) \leq z \Rightarrow X \leq z \bigcap Y \leq z
Z=max(X,Y)≤z⇒X≤z⋂Y≤z
F
Z
(
z
)
=
P
{
Z
≤
z
}
=
P
{
X
≤
z
}
P
{
Y
≤
z
}
=
F
X
(
x
)
F
Y
(
y
)
\begin{aligned} F_Z(z) &=P\{Z\leq z\}\\ &=P\{X \leq z\}P\{Y \leq z\}\\ &=F_X(x)F_Y(y)\\ \end{aligned}
FZ(z)=P{Z≤z}=P{X≤z}P{Y≤z}=FX(x)FY(y)
Z
=
min
(
X
,
Y
)
≤
z
⇒
X
≤
z
⋃
Y
≤
z
Z=\min(X,Y) \leq z \Rightarrow X \leq z \bigcup Y \leq z
Z=min(X,Y)≤z⇒X≤z⋃Y≤z
F
Z
(
z
)
=
P
{
Z
≤
z
}
=
F
X
(
x
)
+
F
Y
(
y
)
−
F
X
(
x
)
F
Y
(
y
)
\begin{aligned} F_Z(z) &=P\{Z\leq z\}\\ &=F_X(x)+F_Y(y)-F_X(x)F_Y(y)\\ \end{aligned}
FZ(z)=P{Z≤z}=FX(x)+FY(y)−FX(x)FY(y)
或者
X
≤
z
⋃
Y
≤
z
⇒
U
n
i
o
n
−
(
X
>
z
⋂
Y
>
z
)
X \leq z \bigcup Y \leq z \Rightarrow Union -(X>z \bigcap Y>z)
X≤z⋃Y≤z⇒Union−(X>z⋂Y>z)
F
Z
(
z
)
=
P
{
Z
≤
z
}
=
1
−
P
{
X
>
z
}
P
{
Y
>
z
}
=
1
−
(
1
−
F
X
(
x
)
)
(
1
−
F
Y
(
y
)
)
=
同上
\begin{aligned} F_Z(z) &=P\{Z\leq z\}\\ &=1-P\{X > z\}P\{Y > z\}\\ &=1-(1-F_X(x))(1-F_Y(y))=同上\\ \end{aligned}
FZ(z)=P{Z≤z}=1−P{X>z}P{Y>z}=1−(1−FX(x))(1−FY(y))=同上
第四章 随机变量的数字特征
第一节 随机变量的数学期望和方差
期望
定义
连续型
E
(
X
)
=
∫
−
∞
+
∞
x
f
(
x
)
d
x
\displaystyle E(X)=\int_{-\infty}^{+\infty} xf(x) dx
E(X)=∫−∞+∞xf(x)dx
E
(
Y
)
=
E
[
g
(
X
)
]
=
∫
−
∞
+
∞
g
(
x
)
f
(
x
)
d
x
E(Y)=E[g(X)]=\displaystyle \int _{-\infty}^{+\infty} g(x)f(x) dx
E(Y)=E[g(X)]=∫−∞+∞g(x)f(x)dx
性质
E
(
a
X
+
b
)
=
a
E
(
X
)
+
b
E(aX+b)=aE(X)+b
E(aX+b)=aE(X)+b
E
(
X
±
Y
)
=
E
(
X
)
±
E
(
Y
)
E(X\pm Y)=E(X)\pm E(Y)
E(X±Y)=E(X)±E(Y)
X
,
Y
独立
⇒
E
(
X
Y
)
=
E
(
X
)
E
(
Y
)
X,Y独立\Rightarrow E(XY)=E(X)E(Y)
X,Y独立⇒E(XY)=E(X)E(Y)
方差
定义
D
(
X
)
=
E
{
[
X
−
E
(
X
)
]
2
}
D(X)=E\{[X-E(X)]^2\}
D(X)=E{[X−E(X)]2}
标准差(均方差)
σ
(
X
)
=
D
(
X
)
\sigma (X)=\sqrt{D(X)}
σ(X)=D(X)
性质
D
(
a
X
+
b
)
=
a
2
D
(
X
)
D(aX+b)=a^2D(X)
D(aX+b)=a2D(X)
X
,
Y
独立
⇒
D
(
X
±
Y
)
=
D
(
X
)
±
D
(
Y
)
X,Y独立\Rightarrow D(X\pm Y)=D(X)\pm D(Y)
X,Y独立⇒D(X±Y)=D(X)±D(Y)
D
(
X
)
=
E
{
[
X
−
E
(
X
)
]
2
}
=
E
{
[
X
2
−
2
X
E
(
X
)
+
E
2
(
X
)
]
}
=
E
(
X
2
)
−
2
E
[
X
E
(
X
)
]
+
E
2
(
X
)
=
E
(
X
2
)
−
2
E
2
(
X
)
+
E
2
(
X
)
=
E
(
X
2
)
−
E
2
(
X
)
\begin{aligned} D(X) &=E\{[X-E(X)]^2\}\\ &=E\{[X^2-2XE(X)+E^2(X)]\}\\ &=E(X^2)-2E[XE(X)]+E^2(X)\\ &=E(X^2)-2E^2(X)+E^2(X)\\ &=E(X^2)-E^2(X)\\ \end{aligned}
D(X)=E{[X−E(X)]2}=E{[X2−2XE(X)+E2(X)]}=E(X2)−2E[XE(X)]+E2(X)=E(X2)−2E2(X)+E2(X)=E(X2)−E2(X)
可得
E
(
X
2
)
−
E
2
(
X
)
≥
0
E(X^2)-E^2(X) \geq 0
E(X2)−E2(X)≥0
矩、协方差和相关系数
定义
X
的
k
阶原点矩:
E
(
X
k
)
X的k阶原点矩:E(X^k)
X的k阶原点矩:E(Xk)
X
的
k
阶中心矩:
E
{
[
X
−
E
(
X
)
]
k
}
X的k阶中心矩:E\{[X-E(X)]^k\}
X的k阶中心矩:E{[X−E(X)]k}
X
和
Y
的
k
+
l
混合矩:
E
(
X
k
Y
l
)
X和Y的k+l混合矩:E(X^k Y^l)
X和Y的k+l混合矩:E(XkYl)
X
和
Y
的
k
+
l
混合中心矩:
E
{
[
X
−
E
(
X
)
]
k
[
Y
−
E
(
Y
)
]
l
}
X和Y的k+l混合中心矩:E\{[X-E(X)]^k [Y-E(Y)]^l\}
X和Y的k+l混合中心矩:E{[X−E(X)]k[Y−E(Y)]l}
协方差
C
o
v
(
X
,
Y
)
=
E
{
[
X
−
E
(
X
)
]
[
Y
−
E
(
Y
)
]
}
协方差Cov(X,Y)=E\{[X-E(X)] [Y-E(Y)]\}
协方差Cov(X,Y)=E{[X−E(X)][Y−E(Y)]}
相关系数 ρ X Y = C o v ( X , Y ) D ( X ) D ( Y ) 相关系数\rho_{XY}=\cfrac{Cov(X,Y)}{\sqrt{D(X)}\sqrt{D(Y)}} 相关系数ρXY=D(X)D(Y)Cov(X,Y)
性质
C
o
v
(
X
,
Y
)
=
E
(
X
Y
)
−
E
(
X
)
E
(
Y
)
Cov(X,Y)=E(XY)-E(X)E(Y)
Cov(X,Y)=E(XY)−E(X)E(Y)
D
(
X
±
Y
)
=
D
(
X
)
+
D
(
Y
)
±
2
C
o
v
(
X
,
Y
)
D(X \pm Y)=D(X)+D(Y) \pm 2Cov(X,Y)
D(X±Y)=D(X)+D(Y)±2Cov(X,Y)
C
o
v
(
a
X
,
b
Y
)
=
a
b
C
o
v
(
X
,
Y
)
Cov(aX,bY)=abCov(X,Y)
Cov(aX,bY)=abCov(X,Y)
C
o
v
(
X
1
+
X
2
,
Y
)
=
C
o
v
(
X
1
,
Y
)
+
C
o
v
(
X
2
,
Y
)
Cov(X_1+X_2,Y)=Cov(X_1,Y)+Cov(X_2,Y)
Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y)
C
o
v
(
X
,
X
)
=
E
(
X
2
)
−
E
(
X
)
E
(
X
)
=
D
(
X
)
Cov(X,X)=E(X^2)-E(X)E(X)=D(X)
Cov(X,X)=E(X2)−E(X)E(X)=D(X)
D
(
X
)
D
(
Y
)
=
0
⇒
ρ
X
Y
=
0
D(X)D(Y)=0 \Rightarrow \rho_{XY}=0
D(X)D(Y)=0⇒ρXY=0
ρ
X
Y
=
0
⇒
X
,
Y
不相关
\rho_{XY}=0 \Rightarrow X,Y不相关
ρXY=0⇒X,Y不相关
∣
ρ
X
Y
∣
=
1
⇒
Y
=
a
X
+
b
|\rho_{XY}|=1 \Rightarrow Y=aX+b
∣ρXY∣=1⇒Y=aX+b
独立与不相关
- X , Y 相互独立 ⇒ X , Y 不相关 X,Y相互独立 \Rightarrow X,Y不相关 X,Y相互独立⇒X,Y不相关
- 二维正态随机变量 ( X , Y ) , X 、 Y 相互独立 ⇔ ρ = 0 二维正态随机变量(X,Y), X、Y相互独立 \Leftrightarrow \rho =0 二维正态随机变量(X,Y),X、Y相互独立⇔ρ=0
- 二维正态随机变量 ( X , Y ) , X 、 Y 相互独立 ⇔ X , Y 不相关 二维正态随机变量(X,Y), X、Y相互独立\Leftrightarrow X,Y不相关 二维正态随机变量(X,Y),X、Y相互独立⇔X,Y不相关
第五章 大数定律和中心极限定理
切比雪夫不等式
E ( X ) 和 D ( x ) 存在 , 对于任意的 ε > 0 , 有 E(X)和D(x)存在,对于任意的\varepsilon>0 ,有 E(X)和D(x)存在,对于任意的ε>0,有 P { ∣ X − E ( X ) ∣ ≥ ε } ≤ D ( X ) ε 2 P\{|X-E(X) |\geq \varepsilon \} \leq \cfrac{D(X)}{\varepsilon^2} P{∣X−E(X)∣≥ε}≤ε2D(X)
收敛
X
1
,
X
2
,
…
,
X
n
,
…
是一个随机变量序列,
A
是一个常数,如果对于任意的
ε
>
0
有
X_1,X_2,\dots,X_n,\dots是一个随机变量序列,A是一个常数,如果对于任意的\varepsilon>0 有
X1,X2,…,Xn,…是一个随机变量序列,A是一个常数,如果对于任意的ε>0有
lim
n
→
+
∞
P
{
∣
X
n
−
A
∣
<
ε
}
=
1
\displaystyle \lim_{n\to+\infty} P\{ |X_n -A|<\varepsilon \}=1
n→+∞limP{∣Xn−A∣<ε}=1
则称
X
1
,
X
2
,
…
,
X
n
,
…
依概率收敛于常数
A
,
记作
X
n
⟶
P
A
则称X_1,X_2,\dots,X_n,\dots \textbf{依概率收敛于常数}A,记作X_n \stackrel{P} \longrightarrow A
则称X1,X2,…,Xn,…依概率收敛于常数A,记作Xn⟶PA
切比雪夫大数定律
X
1
,
X
2
,
…
,
X
n
,
…
是一个两两不相关的随机变量序列,
D
(
X
i
)
≤
C
(
C
是一个常数,
i
=
1
,
2
,
…
)
,则对于任意的
ε
>
0
有
X_1,X_2,\dots,X_n,\dots是一个两两不相关的随机变量序列,D(X_i) \leq C(C 是一个常数,i=1,2,\dots),则对于任意的\varepsilon>0 有
X1,X2,…,Xn,…是一个两两不相关的随机变量序列,D(Xi)≤C(C是一个常数,i=1,2,…),则对于任意的ε>0有
lim
n
→
+
∞
P
{
∣
1
n
∑
i
=
1
n
X
i
−
1
n
∑
i
=
1
n
E
(
X
i
)
∣
<
ε
}
=
1
\displaystyle \lim_{n\to+\infty} P\{|\cfrac{1}{n}\sum^n_{i=1} X_i -\cfrac{1}{n}\sum^n_{i=1}E( X_i)|<\varepsilon \}=1
n→+∞limP{∣n1i=1∑nXi−n1i=1∑nE(Xi)∣<ε}=1
伯努利大数定律
X n ∼ B ( n , p ) , n = 1 , 2 , . . . , 则对于任意的 ε > 0 有 X_n \sim B(n,p),n=1,2,...,则对于任意的\varepsilon>0 有 Xn∼B(n,p),n=1,2,...,则对于任意的ε>0有 lim n → + ∞ P { ∣ X n n − p ∣ < ε } = 1 \displaystyle \lim_{n\to+\infty} P\{| \cfrac{X_n}{n} -p|<\varepsilon \}=1 n→+∞limP{∣nXn−p∣<ε}=1
辛钦大数定律
X
1
,
X
2
,
…
,
X
n
,
…
是独立同分布,
E
(
X
i
)
≤
μ
(
i
=
1
,
2
,
…
)
,则对于任意的
ε
>
0
有
X_1,X_2,\dots,X_n,\dots是独立同分布,E(X_i) \leq \mu(i=1,2,\dots),则对于任意的\varepsilon>0 有
X1,X2,…,Xn,…是独立同分布,E(Xi)≤μ(i=1,2,…),则对于任意的ε>0有
lim
n
→
+
∞
P
{
∣
1
n
∑
i
=
1
n
X
i
−
μ
∣
<
ε
}
=
1
\displaystyle \lim_{n\to+\infty} P\{|\cfrac{1}{n}\sum^n_{i=1} X_i - \mu|<\varepsilon \}=1
n→+∞limP{∣n1i=1∑nXi−μ∣<ε}=1
棣莫弗-拉普拉斯中心极限定理
X
∼
B
(
n
,
p
)
,
则
X \sim B(n,p),则
X∼B(n,p),则
lim
n
→
+
∞
P
{
X
n
−
n
p
n
p
(
1
−
p
)
≤
x
}
=
Φ
(
x
)
\displaystyle \lim_{n\to+\infty} P\{ \cfrac{X_n-np}{\sqrt{np(1-p)}} \leq x \}=\Phi (x)
n→+∞limP{np(1−p)Xn−np≤x}=Φ(x)
,
Φ
(
x
)
是正态分布函数
,\Phi (x) 是正态分布函数
,Φ(x)是正态分布函数
列维-林德伯格中心极限定理
X
1
,
X
2
,
…
,
X
n
,
…
是独立同分布,
E
(
X
i
)
=
μ
,
D
(
X
i
)
=
σ
2
(
i
=
1
,
2
,
…
)
,则对于任意的
ε
>
0
有
X_1,X_2,\dots,X_n,\dots是独立同分布,E(X_i) = \mu, D(X_i)=\sigma^2(i=1,2,\dots),则对于任意的\varepsilon>0 有
X1,X2,…,Xn,…是独立同分布,E(Xi)=μ,D(Xi)=σ2(i=1,2,…),则对于任意的ε>0有
lim
n
→
+
∞
P
{
∑
i
=
1
n
X
i
−
n
μ
n
σ
≤
x
}
=
Φ
(
x
)
\displaystyle \lim_{n\to+\infty} P\{ \cfrac{\displaystyle\sum^n_{i=1} X_i-n\mu}{\sqrt{n}\sigma} \leq x \}=\Phi (x)
n→+∞limP{nσi=1∑nXi−nμ≤x}=Φ(x)
,
Φ
(
x
)
是正态分布函数
,\Phi (x) 是正态分布函数
,Φ(x)是正态分布函数
第六章 数理统计的基本概念
第一节 总体、样本、统计量和样本数字特征
f n ( x 1 , x 2 , . . . , x n ) = ∏ i n f ( x i ) f_n(x_1,x_2,...,x_n)= \displaystyle \prod_i^nf(x_i) fn(x1,x2,...,xn)=i∏nf(xi)
样本
- 样本均值 X ‾ = 1 n ∑ i = 1 n X i \overline{X} =\cfrac{1}{n} \displaystyle\sum_{i=1}^n X_i X=n1i=1∑nXi
- 样本方差
S
2
=
1
n
−
1
∑
i
=
1
n
(
X
i
−
X
‾
)
2
S^2=\cfrac{1}{n-1} \displaystyle\sum_{i=1}^n (X_i- \overline{X})^2
S2=n−11i=1∑n(Xi−X)2
D ( X ‾ ) = 1 n D ( X ) D(\overline{X})=\cfrac{1}{n} D(X) D(X)=n1D(X)
( n − 1 ) D ( X ) = n D ( X ) − D ( X ) = n D ( X ) − n D ( X ‾ ) = [ ∑ i = 1 n X i 2 − n E 2 ( X ) ] − [ ∑ i = 1 n X ‾ − n E 2 ( X ‾ 2 ) ] = ∑ i = 1 n X i 2 − ∑ i = 1 n X ‾ 2 = ∑ i = 1 n X i 2 − 2 ∑ i = 1 n X i 2 X ‾ 2 + ∑ i = 1 n X ‾ 2 = ∑ i = 1 n ( X i − X ‾ ) 2 \begin{aligned} (n-1)D(X) &=nD(X)-D(X)\\ &=nD(X)-nD(\overline{X})\\ &=[\sum_{i=1}^n X_i^2-nE^2(X)] - [\sum_{i=1}^n \overline{X} -nE^2(\overline{X}^2)]\\ &=\sum_{i=1}^n X_i^2 -\sum_{i=1}^n \overline{X}^2\\ &=\sum_{i=1}^n X_i^2 -2\sum_{i=1}^n X_i^2\overline{X}^2+\sum_{i=1}^n \overline{X}^2\\ &=\sum_{i=1}^n (X_i- \overline{X})^2\\ \end{aligned} (n−1)D(X)=nD(X)−D(X)=nD(X)−nD(X)=[i=1∑nXi2−nE2(X)]−[i=1∑nX−nE2(X2)]=i=1∑nXi2−i=1∑nX2=i=1∑nXi2−2i=1∑nXi2X2+i=1∑nX2=i=1∑n(Xi−X)2
即 D ( X ) = ∑ i = 1 n ( X i − X ‾ ) 2 n − 1 D(X)=\cfrac{\displaystyle \sum_{i=1}^n (X_i- \overline{X})^2}{n-1} D(X)=n−1i=1∑n(Xi−X)2
- 样本 k k k阶原点矩 A k = 1 n ∑ i = 1 n X i k , A 1 = X ‾ A_k =\cfrac{1}{n} \displaystyle\sum_{i=1}^n X_i^k, A_1=\overline{X} Ak=n1i=1∑nXik,A1=X
- 样本 k k k阶中心矩 B k = 1 n ∑ i = 1 n ( X i − X ‾ ) k , B 2 = n − 1 n S 2 B_k=\cfrac{1}{n} \displaystyle\sum_{i=1}^n (X_i- \overline{X})^k, B_2=\cfrac{n-1}{n}S^2 Bk=n1i=1∑n(Xi−X)k,B2=nn−1S2
第二节 常用统计抽样分布
χ 2 \chi^2 χ2分布
定义
自由度为
n
的
χ
2
分布
:
自由度为n的\chi^2分布:
自由度为n的χ2分布:
χ
2
∼
χ
2
(
n
)
\chi^2 \sim \chi^2(n)
χ2∼χ2(n)
χ
2
=
∑
i
=
1
n
X
i
2
,
X
i
∼
N
(
0
,
1
)
且相互独立
\chi^2=\displaystyle\sum_{i=1}^n X^2_i, X_i \sim N(0,1)且相互独立
χ2=i=1∑nXi2,Xi∼N(0,1)且相互独立
性质
- P { χ 2 > χ α 2 ( n ) } = ∫ χ α 2 ( n ) + ∞ f ( x ) d x = α P\{\chi^2>\chi^2_\alpha(n) \}=\displaystyle\int_{\chi^2_\alpha(n)}^{+\infty}f(x)dx=\alpha P{χ2>χα2(n)}=∫χα2(n)+∞f(x)dx=α
- E ( χ 2 ) = n , D ( χ 2 ) = 2 n E(\chi^2)=n,D(\chi^2)=2n E(χ2)=n,D(χ2)=2n
助记
χ 2 ( n ) ∼ ( n , 2 n ) \chi^2(n) \sim (n,2n) χ2(n)∼(n,2n)
t分布
定义
自由度为
n
的
t
分布
:
自由度为n的t分布:
自由度为n的t分布:
T
∼
t
(
n
)
T \sim t(n)
T∼t(n)
X
∼
N
(
0
,
1
)
,
Y
∼
χ
2
(
n
)
,
X
、
Y
独立
X\sim N(0,1),Y\sim \chi^2(n),X、Y独立
X∼N(0,1),Y∼χ2(n),X、Y独立
T
=
X
Y
n
T=\cfrac{X}{\sqrt{\frac{Y}{n}}}
T=nYX
性质
- f ( x ) = f ( − x ) , n 够大时,趋近于 N ( 0 , 1 ) f(x)=f(-x),n够大时,趋近于N(0,1) f(x)=f(−x),n够大时,趋近于N(0,1)
- P { T > t α ( n ) } = ∫ t α ( n ) + ∞ f ( x ) d x = α P\{T>t_\alpha(n) \}=\displaystyle\int_{t_\alpha(n)}^{+\infty}f(x)dx=\alpha P{T>tα(n)}=∫tα(n)+∞f(x)dx=α
- t α ( n ) = − t 1 − α t_\alpha(n)=-t_{1-\alpha} tα(n)=−t1−α 待续
- P { ∣ T ∣ > t α 2 ( n ) } = α P\{|T|>t_{\frac{\alpha}{2}}(n)\}=\alpha P{∣T∣>t2α(n)}=α
助记
t ( n ) ∼ ( 0 , 1 ) ( 1 , 1 n ) t(n) \sim \cfrac{(0,1)}{\sqrt{(1,\frac{1}{n})}} t(n)∼(1,n1)(0,1)
F分布
定义
自由度为
(
n
1
,
n
2
)
的
F
分布
:
自由度为(n_1,n_2)的F分布:
自由度为(n1,n2)的F分布:
F
∼
F
(
n
1
,
n
2
)
F\sim F(n_1,n_2)
F∼F(n1,n2)
X
∼
χ
2
(
n
1
)
,
Y
∼
χ
2
(
n
2
)
,
X
、
Y
独立
X\sim \chi^2(n_1),Y\sim \chi^2(n_2),X、Y独立
X∼χ2(n1),Y∼χ2(n2),X、Y独立
F
=
X
n
1
Y
n
2
F=\cfrac{\frac{X}{n_1}}{\frac{Y}{n_2}}
F=n2Yn1X
性质
- P { F > F α ( n 1 , n 2 ) } = ∫ F α ( n 1 , n 2 ) + ∞ f ( x ) d x = α P\{F>F_\alpha(n_1,n_2) \}=\displaystyle\int_{F_\alpha(n_1,n_2)}^{+\infty}f(x)dx=\alpha P{F>Fα(n1,n2)}=∫Fα(n1,n2)+∞f(x)dx=α
- 1 F ∼ F ( n 2 , n 1 ) \frac{1}{F}\sim F(n_2,n_1) F1∼F(n2,n1)
- F α ( n 1 , n 2 ) ∼ 1 F 1 − α ( n 2 , n 1 ) F_\alpha(n_1,n_2)\sim \cfrac{1}{F_{1-\alpha}(n_2,n_1)} Fα(n1,n2)∼F1−α(n2,n1)1
助记
F ( n ) ∼ ( 1 , 1 n 1 ) ( 1 , 1 n 2 ) F(n) \sim \cfrac{(1,\frac{1}{n_1})}{(1,\frac{1}{n_2})} F(n)∼(1,n21)(1,n11)
正态总体的抽样分布
一个正态总体
X
i
∼
N
(
μ
,
σ
2
)
X_i\sim N(\mu,\sigma^2)
Xi∼N(μ,σ2)
均值
X
‾
,样本方差
S
2
均值\overline{X},样本方差S^2
均值X,样本方差S2
- X ‾ ∼ N ( μ , σ 2 n ) , U = X ‾ − μ σ 2 ∼ N ( 0 , 1 ) \overline{X} \sim N(\mu,\frac{\sigma^2}{n}),U=\cfrac{\overline{X}-\mu}{\sigma^2}\sim N(0,1) X∼N(μ,nσ2),U=σ2X−μ∼N(0,1)
- X ‾ 和 S 2 相互独立, χ 2 = ( n − 1 ) S 2 σ 2 = ∑ i = 1 n ( X i − X ‾ ) 2 σ 2 ∼ χ 2 ( n − 1 ) \overline{X}和S^2相互独立,\chi^2=\cfrac{(n-1)S^2}{\sigma^2}=\cfrac{\displaystyle\sum_{i=1}^n (X_i- \overline{X})^2}{\sigma^2}\sim\chi^2(n-1) X和S2相互独立,χ2=σ2(n−1)S2=σ2i=1∑n(Xi−X)2∼χ2(n−1)
- T = X ‾ − μ S n ∼ t ( n − 1 ) T=\cfrac{\overline{X}-\mu}{\frac{S}{\sqrt{n}}} \sim t(n-1) T=nSX−μ∼t(n−1)
- χ 2 = ∑ i = 1 n ( X i − μ ) 2 σ 2 ∼ χ 2 ( n ) \chi^2=\cfrac{\displaystyle \sum_{i=1}^n (X_i- \mu)^2}{\sigma^2}\sim \chi^2(n) χ2=σ2i=1∑n(Xi−μ)2∼χ2(n)
两个正态总体
X
i
∼
N
(
μ
1
,
σ
1
2
)
,
Y
j
∼
N
(
μ
2
,
σ
2
2
)
,
1
≤
i
≤
n
1
,
1
≤
j
≤
n
2
X_i \sim N(\mu_1,\sigma _1^2 ) ,Y_j \sim N(\mu_2,\sigma _2^2 ),1\leq i\leq n_1,1\leq j\leq n_2
Xi∼N(μ1,σ12),Yj∼N(μ2,σ22),1≤i≤n1,1≤j≤n2
均值
X
‾
和
Y
‾
,样本方差
S
1
2
和
S
2
2
均值\overline{X}和\overline{Y},样本方差S_1^2和S_2^2
均值X和Y,样本方差S12和S22
-
X
‾
−
Y
‾
∼
N
(
μ
1
−
μ
2
,
σ
1
2
n
1
+
σ
2
2
n
2
)
\overline{X}-\overline{Y} \sim N(\mu_1-\mu_2,\cfrac{\sigma _1^2}{n_1}+\cfrac{\sigma _2^2}{n_2})
X−Y∼N(μ1−μ2,n1σ12+n2σ22)
U = ( X ‾ − Y ‾ ) − ( μ 1 − μ 2 ) σ 1 2 n 1 + σ 2 2 n 2 U=\cfrac{(\overline{X}-\overline{Y})-(\mu_1-\mu_2)}{\sqrt{\frac{\sigma _1^2}{n_1}+\frac{\sigma _2^2}{n_2}}} U=n1σ12+n2σ22(X−Y)−(μ1−μ2) - 如果
σ
1
2
=
σ
2
2
\sigma _1^2=\sigma _2^2
σ12=σ22则
{ T = ( X ‾ − Y ‾ ) − ( μ 1 − μ 2 ) S w 1 n 1 + 1 n 2 ∼ t ( n 1 + n 2 − 2 ) S w = ( n 1 − 1 ) S 1 2 + ( n 2 − 1 ) S 2 2 n 1 + n 2 − 2 \left\{\begin{aligned} &T=\cfrac{(\overline{X}-\overline{Y})-(\mu_1-\mu_2)}{S_w\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}\sim t(n_1+n_2-2)\\ &S_w=\cfrac{(n_1-1)S_1^2+(n_2-1)S_2^2}{n_1+n_2-2}\\ \end{aligned}\right. ⎩ ⎨ ⎧T=Swn11+n21(X−Y)−(μ1−μ2)∼t(n1+n2−2)Sw=n1+n2−2(n1−1)S12+(n2−1)S22 - F = S 1 2 σ 1 2 S 2 2 σ 2 2 ∼ F ( n 1 − 1 , n 2 − 1 ) F=\cfrac{\frac{S_1^2}{\sigma _1^2 }}{\frac{S_2^2}{\sigma _2^2 }} \sim F(n_1-1,n_2-1) F=σ22S22σ12S12∼F(n1−1,n2−1)
第七章 参数估计
第一节 点估计
未知参数
θ
,
θ
^
(
X
1
,
X
2
,
…
,
X
n
)
称为
估计量
未知参数\theta,\widehat{\theta } (X_1,X_2,\dots,X_n) 称为\textbf{估计量}
未知参数θ,θ
(X1,X2,…,Xn)称为估计量
若
E
(
θ
^
)
=
θ
,
θ
^
是
θ
的
无偏估计量
若E(\widehat{\theta } )=\theta,\widehat{\theta } 是\theta的\textbf{无偏估计量}
若E(θ
)=θ,θ
是θ的无偏估计量
{
E
(
θ
^
1
)
=
E
(
θ
^
2
)
=
θ
D
(
θ
^
1
)
≤
D
(
θ
^
2
)
⇒
θ
^
1
比
θ
^
2
更有效
\left\{\begin{aligned} &E(\widehat{\theta }_1 )=E(\widehat{\theta }_2 )=\theta\\ &D(\widehat{\theta }_1) \leq D(\widehat{\theta }_2)\\ \end{aligned}\right. \Rightarrow \widehat{\theta }_1比\widehat{\theta }_2\textbf{更有效}
{E(θ
1)=E(θ
2)=θD(θ
1)≤D(θ
2)⇒θ
1比θ
2更有效
如果 θ ^ ( X 1 , X 2 , … , X n ) 依概率收敛于 θ ,则称 θ ^ 是 θ 的 一致估计量 如果\widehat{\theta } (X_1,X_2,\dots,X_n) 依概率收敛于\theta,则称\widehat{\theta }是\theta 的\textbf{一致估计量} 如果θ (X1,X2,…,Xn)依概率收敛于θ,则称θ 是θ的一致估计量
第二节 估计量的求法和区间估计
矩估计法
定义:用样本矩估计相应的总体矩,用样本矩的函数估计总体矩相应的函数,然后求出要估计的参数
步骤:设总体X的分布含有未知参数$\theta_1,\theta_2,\dots,\theta _k,\alpha _k = E(X^l) $ 存在,
α
l
是关于
θ
1
,
θ
2
,
…
,
θ
k
\alpha _l是关于\theta_1,\theta_2,\dots,\theta _k
αl是关于θ1,θ2,…,θk 的函数,记作
α
l
(
θ
1
,
θ
2
,
…
,
θ
k
)
,
l
=
1
,
2
,
…
,
k
\alpha _l(\theta_1,\theta_2,\dots,\theta _k),l=1,2,\dots ,k
αl(θ1,θ2,…,θk),l=1,2,…,k 。样本的
l
l
l阶原点矩为
A
l
=
∑
i
=
1
n
X
i
l
n
。
A_l= \cfrac{\displaystyle \sum_{i=1}^n X_i^l}{n}。
Al=ni=1∑nXil。令
α
l
(
θ
1
,
θ
2
,
…
,
θ
k
)
=
A
l
,
l
=
1
,
2
,
…
,
k
⇒
\alpha _l(\theta_1,\theta_2,\dots,\theta _k)=A_l,l=1,2,\dots ,k \Rightarrow
αl(θ1,θ2,…,θk)=Al,l=1,2,…,k⇒ 可以解得
θ
1
,
θ
2
,
…
,
θ
k
\theta_1,\theta_2,\dots,\theta _k
θ1,θ2,…,θk
设 g ( a 1 , a 2 ) g(a_1,a_2) g(a1,a2)是一阶矩 a 1 a_1 a1和二阶矩 a 2 a_2 a2的函数,而 a ^ 1 、 a ^ 2 是 a 1 、 a 2 \widehat{a }_1、\widehat{a }_2是a_1、a_2 a 1、a 2是a1、a2的矩估计,则 g ( a ^ 1 , a ^ 2 ) g(\widehat{a }_1,\widehat{a }_2) g(a 1,a 2)就是 g ( a 1 , a 2 ) g(a_1,a_2) g(a1,a2)的矩估计
最大似然估计法
X
i
是
X
的样本,
x
i
是样本值,
θ
是代估函数
X_i是X的样本,x_i是样本值,\theta 是代估函数
Xi是X的样本,xi是样本值,θ是代估函数
参数
θ
\theta
θ的似然函数
离散型:
L
(
θ
)
=
L
(
x
1
,
x
2
,
…
,
x
n
;
θ
)
=
∏
i
=
1
n
p
(
x
i
;
θ
)
L(\theta)=L(x_1,x_2,\dots,x_n;\theta)=\displaystyle\prod_{i=1}^n p(x_i;\theta)
L(θ)=L(x1,x2,…,xn;θ)=i=1∏np(xi;θ)
连续型:
L
(
θ
)
=
L
(
x
1
,
x
2
,
…
,
x
n
;
θ
)
=
∏
i
=
1
n
f
(
x
i
;
θ
)
L(\theta)=L(x_1,x_2,\dots,x_n;\theta)=\displaystyle\prod_{i=1}^n f(x_i;\theta)
L(θ)=L(x1,x2,…,xn;θ)=i=1∏nf(xi;θ)
最大似然估计法
定义
对于给定的样本
(
x
1
,
x
2
,
…
,
x
n
)
(x_1,x_2,\dots,x_n)
(x1,x2,…,xn),使似然函数
L
(
x
1
,
x
2
,
…
,
x
n
;
θ
)
L(x_1,x_2,\dots,x_n;\theta)
L(x1,x2,…,xn;θ)达到最大值的参数
θ
^
=
θ
^
(
x
1
,
x
2
,
…
,
x
n
)
\widehat{\theta }=\widehat{\theta } (x_1,x2,\dots,x_n)
θ
=θ
(x1,x2,…,xn) 称为未知参数
θ
\theta
θ的最大似然估计值,相应的使似然函数
L
(
X
1
,
X
2
,
…
,
X
n
;
θ
)
L(X_1,X_2,\dots,X_n;\theta)
L(X1,X2,…,Xn;θ)达到最大值的参数值
θ
^
=
θ
^
(
X
1
,
X
2
,
…
,
X
n
)
\widehat{\theta } =\widehat{\theta }(X_1,X_2,\dots,X_n)
θ
=θ
(X1,X2,…,Xn)称为
θ
\theta
θ的最大似然估计量。统称为
θ
\theta
θ的最大似然估计
步骤
求
θ
^
\widehat{\theta }
θ
,可用似然方程
d
L
(
θ
)
d
θ
=
0
或
d
ln
L
(
θ
)
d
θ
=
0
\cfrac{\mathrm{d}L(\theta )}{\mathrm{d}\theta }=0 或\cfrac{\mathrm{d}\ln L(\theta )}{\mathrm{d}\theta }=0
dθdL(θ)=0或dθdlnL(θ)=0
假设要估计的参数是
θ
1
与
θ
2
\theta_1与\theta_2
θ1与θ2,则可得似然方程
{
∂
L
(
θ
)
∂
θ
1
=
0
∂
L
(
θ
)
∂
θ
2
=
0
或
{
∂
ln
L
(
θ
)
∂
θ
1
=
0
∂
ln
L
(
θ
)
∂
θ
2
=
0
\left\{\begin{aligned} &\cfrac{\partial L(\theta )}{\partial \theta_1 }=0\\ &\cfrac{\partial L(\theta )}{\partial \theta_2 }=0\\ \end{aligned}\right. 或 \left\{\begin{aligned} &\cfrac{\partial \ln L(\theta )}{\partial \theta_1 }=0\\ &\cfrac{\partial \ln L(\theta )}{\partial \theta_2 }=0\\ \end{aligned}\right.
⎩
⎨
⎧∂θ1∂L(θ)=0∂θ2∂L(θ)=0或⎩
⎨
⎧∂θ1∂lnL(θ)=0∂θ2∂lnL(θ)=0
第八章
常用公式
∫ 0 + ∞ x n e − x d x = n ! \displaystyle \int_{0}^{+\infty} x^n e^{-x} dx=n! ∫0+∞xne−xdx=n!
∫ 0 + ∞ e − x 2 2 d x = π 2 , ∫ 0 + ∞ x e − x 2 2 d x = 1 \displaystyle \int_{0}^{+\infty} e^{-\frac{x^2}{2}}dx =\cfrac{\sqrt{\pi}}{\sqrt{2}}, \;\;\;\;\;\;\;\;\;\;\;\;\displaystyle \int_{0}^{+\infty}xe^{-\frac{x^2}{2}}dx =1 ∫0+∞e−2x2dx=2π,∫0+∞xe−2x2dx=1
∫ 0 + ∞ t x e − t x d x = 1 \displaystyle \int_{0}^{+\infty} txe^{-tx} dx =1 ∫0+∞txe−txdx=1
∑
i
=
1
n
(
X
i
−
X
‾
)
2
=
∑
i
=
1
n
X
i
2
−
∑
i
=
1
n
X
‾
2
=
∑
i
=
1
n
X
i
2
−
n
X
‾
2
\displaystyle\sum_{i=1}^n (X_i- \overline{X})^2=\sum_{i=1}^n X_i^2 -\sum_{i=1}^n \overline{X}^2=\sum_{i=1}^n X_i^2 -n \overline{X}^2
i=1∑n(Xi−X)2=i=1∑nXi2−i=1∑nX2=i=1∑nXi2−nX2
∑
i
=
1
n
(
X
i
−
X
‾
)
2
=
∑
i
=
1
n
(
X
i
−
μ
)
2
−
n
(
X
‾
−
μ
)
2
\displaystyle\sum_{i=1}^n (X_i- \overline{X})^2=\sum_{i=1}^n (X_i-\mu)^2- n(\overline{X}-\mu)^2
i=1∑n(Xi−X)2=i=1∑n(Xi−μ)2−n(X−μ)2
(
n
−
1
)
S
2
∼
∑
i
=
1
n
(
X
i
−
X
‾
)
2
∼
χ
2
(
n
−
1
)
\displaystyle(n-1)S^2\sim \sum_{i=1}^n (X_i- \overline{X})^2\sim \chi^2(n-1)
(n−1)S2∼i=1∑n(Xi−X)2∼χ2(n−1)
n
(
X
‾
−
μ
)
2
σ
2
∼
χ
2
(
1
)
n \cfrac{(\overline{X}-\mu) ^2}{\sigma^2} \sim \chi^2(1)
nσ2(X−μ)2∼χ2(1)
易混点
独立 ⇒ \Rightarrow ⇒不相关,相关 ⇒ \Rightarrow ⇒不独立