概率论的基本概念
事件频率
- 对任一事件 A A A: 0 ≤ f n ( A ) ≤ 1 0 \leq f_n(A) \leq 1 0≤fn(A)≤1
- f n ( S ) = 1 f_n(S)=1 fn(S)=1
- 当事件 A A A 和事件 B B B 不相容时, f n ( A ∪ B ) = f n ( A ) + f n ( B ) f_n(A \cup B)=f_n(A)+f_n(B) fn(A∪B)=fn(A)+fn(B)
- 推广: f n ( ⋃ j = 1 k A j ) = ∑ j = 1 k f n ( A j ) f_n\left(\displaystyle\bigcup_{j=1}^k{A_j}\right)=\displaystyle\sum_{j=1}^k{f_n(A_j)} fn(j=1⋃kAj)=j=1∑kfn(Aj)
概率公理
- 非负性: P ( A ) ≥ 0 P(A) \ge 0 P(A)≥0
- 规范性: P ( S ) = 1 P(S)=1 P(S)=1
- 可列可加性:对 S S S 中的可列个两两不相容事件 A 1 , A 2 , … , A n , … A_1,A_2,\dots,A_n,\dots A1,A2,…,An,…,有 P ( ⋃ j = 1 + ∞ A j ) = ∑ j = 1 + ∞ P ( A j ) P\left(\displaystyle\bigcup_{j=1}^{+\infty}{A_j}\right)=\displaystyle\sum_{j=1}^{+\infty}{P(A_j)} P(j=1⋃+∞Aj)=j=1∑+∞P(Aj)
概率性质
- 对于有限个两两不相容的事件的和事件,有 P ( ⋃ j = 1 n A j ) = ∑ j = 1 n P ( A j ) P\left(\displaystyle\bigcup_{j=1}^n{A_j}\right)=\displaystyle\sum_{j=1}^n{P(A_j)} P(j=1⋃nAj)=j=1∑nP(Aj)
- P ( A ˉ ) = 1 − P ( A ) P(\bar{A})=1-P(A) P(Aˉ)=1−P(A)
- 当
B
⊂
A
B \subset A
B⊂A 时,
P
(
A
−
B
)
=
P
(
A
)
−
P
(
B
)
P(A-B)=P(A)-P(B)
P(A−B)=P(A)−P(B),从而
P
(
A
)
≥
P
(
B
)
P(A) \ge P(B)
P(A)≥P(B)
证明: A = B ∪ A B ˉ ⇒ ∵ B ∩ A B ˉ = ∅ P ( A ) = P ( B ) + P ( A B ˉ ) = P ( B ) + P ( A − B ) A=B \cup A\bar{B} \xRightarrow{\because B \cap A\bar{B}=\varnothing} P(A)=P(B)+P(A\bar{B})=P(B)+P(A-B) A=B∪ABˉ∵B∩ABˉ=∅P(A)=P(B)+P(ABˉ)=P(B)+P(A−B)
∴ P ( A − B ) = P ( A ) − P ( B ) ⇒ ∵ P ( A − B ) ≥ 0 P ( A ) ≥ P ( B ) \therefore P(A-B)=P(A)-P(B) \xRightarrow{\because P(A-B) \ge 0} P(A) \ge P(B) ∴P(A−B)=P(A)−P(B)∵P(A−B)≥0P(A)≥P(B) - 一般情况下: P ( A − B ) = P ( A ) − P ( A B ) P(A-B)=P(A)-P(AB) P(A−B)=P(A)−P(AB)
- 概率加法公式:
P
(
A
∪
B
)
=
P
(
A
)
+
P
(
B
)
−
P
(
A
B
)
P(A \cup B)=P(A)+P(B)-P(AB)
P(A∪B)=P(A)+P(B)−P(AB)
证明: { A = A ∩ ( B ∪ B ˉ ) = A B ∪ A B ˉ ⇒ ∵ A B ∩ A B ˉ = ∅ P ( A ) = P ( A B ) + P ( A B ˉ ) A ∪ B = B ∪ A B ˉ ⇒ ∵ B ∩ A B ˉ = ∅ P ( A ∪ B ) = P ( B ) + P ( A B ˉ ) \begin{cases}A=A \cap (B \cup \bar{B})=AB \cup A\bar{B} \xRightarrow{\because AB \cap A\bar{B}=\varnothing} P(A)=P(AB)+P(A\bar{B}) \\ A \cup B=B \cup A\bar{B} \xRightarrow{\because B \cap A\bar{B}=\varnothing} P(A \cup B)=P(B)+P(A\bar{B})\end{cases} {A=A∩(B∪Bˉ)=AB∪ABˉ∵AB∩ABˉ=∅P(A)=P(AB)+P(ABˉ)A∪B=B∪ABˉ∵B∩ABˉ=∅P(A∪B)=P(B)+P(ABˉ)
∴ P ( A ∪ B ) = P ( A ) + P ( B ) − P ( A B ) \therefore P(A \cup B)=P(A)+P(B)-P(AB) ∴P(A∪B)=P(A)+P(B)−P(AB) - 推广: P ( ⋃ j = 1 n A j ) = ∑ j = 1 n P ( A j ) − ∑ i < j P ( A i A j ) + ∑ i < j < k P ( A i A j A k ) − ⋯ + ( − 1 ) n − 1 P ( A 1 A 2 ⋯ A n ) P\left(\displaystyle\bigcup_{j=1}^n{A_j}\right)=\displaystyle\sum_{j=1}^n{P(A_j)}-\displaystyle\sum_{i<j}{P(A_iA_j)}+\displaystyle\sum_{i<j<k}{P(A_iA_jA_k)}- \cdots +(-1)^{n-1}P(A_1A_2 \cdots A_n) P(j=1⋃nAj)=j=1∑nP(Aj)−i<j∑P(AiAj)+i<j<k∑P(AiAjAk)−⋯+(−1)n−1P(A1A2⋯An)
条件概率
- 如果 P ( B ) > 0 P(B)>0 P(B)>0,那么在 B B B 发生的条件下 A A A 发生的条件概率为 P ( A ∣ B ) = P ( A B ) P ( B ) P(A|B)=\dfrac{P(AB)}{P(B)} P(A∣B)=P(B)P(AB)
- 当
P
(
C
)
≠
0
P(C) \ne 0
P(C)=0 时,有:
- P ( A ∣ C ) ≥ 0 P(A|C) \ge 0 P(A∣C)≥0
- P ( S ∣ C ) = 1 P(S|C)=1 P(S∣C)=1
- P ( B ∣ C ) = 1 − P ( B ˉ ∣ C ) P(B|C)=1-P(\bar{B}|C) P(B∣C)=1−P(Bˉ∣C)
- 当 A ⊃ B A \supset B A⊃B 时, P ( A ∣ C ) ≥ P ( B ∣ C ) P(A|C) \ge P(B|C) P(A∣C)≥P(B∣C)
- P ( A ∪ B ∣ C ) = P ( A ∣ C ) + P ( B ∣ C ) − P ( A B ∣ C ) P(A \cup B|C)=P(A|C)+P(B|C)-P(AB|C) P(A∪B∣C)=P(A∣C)+P(B∣C)−P(AB∣C)
- 特别地,若 A B = ∅ AB=\varnothing AB=∅,则 P ( A ∪ B ∣ C ) = P ( A ∣ C ) + P ( B ∣ C ) P(A \cup B|C)=P(A|C)+P(B|C) P(A∪B∣C)=P(A∣C)+P(B∣C)
- 乘法公式:当 P ( A ) ≠ 0 P(A) \ne 0 P(A)=0 且 P ( B ) ≠ 0 P(B) \ne 0 P(B)=0 时, P ( A B ) = P ( A ) ⋅ P ( B ∣ A ) = P ( B ) ⋅ P ( A ∣ B ) P(AB)=P(A) \cdot P(B|A)=P(B) \cdot P(A|B) P(AB)=P(A)⋅P(B∣A)=P(B)⋅P(A∣B)
- 全概率公式:设
S
S
S 为某一试验的样本空间,
A
A
A 为该试验的事件,设
B
1
,
B
2
,
…
,
B
n
B_1,B_2,\dots,B_n
B1,B2,…,Bn 是
S
S
S 的一个划分,且
P
(
B
j
)
>
0
P(B_j)>0
P(Bj)>0,则
P
(
A
)
=
∑
j
=
1
n
P
(
B
j
)
P
(
A
∣
B
j
)
P(A)=\displaystyle\sum_{j=1}^n{P(B_j)P(A|B_j)}
P(A)=j=1∑nP(Bj)P(A∣Bj)
证明: A = A S = A ∩ ( ⋃ j = 1 n B j ) = ⋃ j = 1 n A B j ⇒ ∵ P ( A B j ) = P ( B j ) ⋅ P ( A ∣ B j ) P ( A ) ∑ j = 1 n P ( B j ) P ( A ∣ B j ) A=AS=A \cap \left(\displaystyle\bigcup_{j=1}^n{B_j}\right)=\displaystyle\bigcup_{j=1}^n{AB_j} \xRightarrow{\because P(AB_j)=P(B_j) \cdot P(A|B_j)} P(A)\displaystyle\sum_{j=1}^n{P(B_j)P(A|B_j)} A=AS=A∩(j=1⋃nBj)=j=1⋃nABj∵P(ABj)=P(Bj)⋅P(A∣Bj)P(A)j=1∑nP(Bj)P(A∣Bj) - 贝叶斯公式:设 S S S 为某一试验的样本空间, A A A 为该试验的事件且 P ( A ) ≠ 0 P(A) \ne 0 P(A)=0,设 B 1 , B 2 , … , B n B_1,B_2,\dots,B_n B1,B2,…,Bn 是 S S S 的一个划分,且 P ( B j ) > 0 P(B_j)>0 P(Bj)>0,则 P ( B k ∣ A ) = P ( B k A ) P ( A ) = P ( B k ) P ( A ∣ B k ) ∑ j = 1 n P ( B j ) P ( A ∣ B j ) P(B_k|A)=\dfrac{P(B_kA)}{P(A)}=\dfrac{P(B_k)P(A|B_k)}{\displaystyle\sum_{j=1}^n{P(B_j)P(A|B_j)}} P(Bk∣A)=P(A)P(BkA)=j=1∑nP(Bj)P(A∣Bj)P(Bk)P(A∣Bk)
事件的独立性
- 设 A A A 和 B B B 为两随机事件,当 P ( A B ) = P ( A ) ⋅ P ( B ) P(AB)=P(A) \cdot P(B) P(AB)=P(A)⋅P(B) 时称事件 A A A 和事件 B B B 相互独立
- 当 P ( A ) ⋅ P ( B ) ≠ 0 P(A) \cdot P(B) \ne 0 P(A)⋅P(B)=0 时,“事件 A A A 和事件 B B B 相互独立”等价于条件概率等于无条件概率,即 P ( B ∣ A ) = P ( B ) P(B|A)=P(B) P(B∣A)=P(B) 或 P ( A ∣ B ) = P ( A ) P(A|B)=P(A) P(A∣B)=P(A)
- 当事件 A A A 和事件 B B B 相互独立时, A A A 和 B ˉ \bar{B} Bˉ、 A ˉ \bar{A} Aˉ 和 B B B、 A ˉ \bar{A} Aˉ 和 B ˉ \bar{B} Bˉ 均相互独立
- 设 A , B , C A,B,C A,B,C 为三个随机事件,当 { P ( A B ) = P ( A ) P ( B ) P ( B C ) = P ( B ) P ( C ) P ( C A ) = P ( C ) P ( A ) \begin{cases} P(AB)=P(A)P(B) \\ P(BC)=P(B)P(C) \\ P(CA)=P(C)P(A) \end{cases} ⎩⎪⎨⎪⎧P(AB)=P(A)P(B)P(BC)=P(B)P(C)P(CA)=P(C)P(A) 都成立时,称事件 A , B , C A,B,C A,B,C 两两独立;如果还满足 P ( A B C ) = P ( A ) P ( B ) P ( C ) P(ABC)=P(A)P(B)P(C) P(ABC)=P(A)P(B)P(C),则称事件 A , B , C A,B,C A,B,C 相互独立
- 若 n n n 个事件 A 1 , A 2 , … , A n ( n ≥ 2 ) A_1,A_2,\dots,A_n (n \ge 2) A1,A2,…,An(n≥2) 的任一子排列 A i 1 , A i 2 , … , A i k ( 2 ≤ k ≤ n ) A_{i_1},A_{i_2},\dots,A_{i_k} (2 \leq k \leq n) Ai1,Ai2,…,Aik(2≤k≤n) 都满足 P ( A i 1 A i 2 ⋯ A i k ) = ∏ j = 1 k P ( A i j ) P(A_{i_1}A_{i_2} \cdots A_{i_k})=\displaystyle\prod_{j=1}^k{P(A_{i_j})} P(Ai1Ai2⋯Aik)=j=1∏kP(Aij),则称事件 A 1 , A 2 , … , A n A_1,A_2,\dots,A_n A1,A2,…,An 相互独立
随机变量及其概率分布
二项分布
- 若随机变量 X X X 的概率分布律为 P { X = k } = C n k ( 1 − p ) n − k p k ( k ∈ N ) P\{X=k\}=C_n^k(1-p)^{n-k}p^k \ (k \in \mathbb{N}) P{X=k}=Cnk(1−p)n−kpk (k∈N),其中 0 < p < 1 0<p<1 0<p<1 且 n ≥ 1 n \ge 1 n≥1,则称 X X X 服从参数为 ( n , p ) (n,p) (n,p) 的二项分布,记作 X ∼ B ( n , p ) X \sim B(n,p) X∼B(n,p)
泊松分布
- 若随机变量 X X X 的概率分布律为 P { X = k } = e − λ ⋅ λ k k ! ( k ∈ N ) P\{X=k\}=e^{-\lambda} \cdot \dfrac{\lambda^k}{k!} \ (k \in \mathbb{N}) P{X=k}=e−λ⋅k!λk (k∈N),其中 λ > 0 \lambda>0 λ>0,则称 X X X 服从参数为 λ \lambda λ 的泊松分布,记作 X ∼ P ( λ ) X \sim P(\lambda) X∼P(λ)
- 当 n n n 足够大、 p p p 足够小时,可以用泊松分布 P ( n p ) P(np) P(np) 近似估计二项分布 B ( n , p ) B(n,p) B(n,p)
随机变量的分布函数
- F ( x ) = P { X ≤ x } = ∑ x i ≤ x P { X = x i } o r ∫ − ∞ x P { X = x } d x F(x)=P\{X \leq x\}=\displaystyle\sum_{x_i \leq x}{P\{X=x_i\}} \ \ \mathrm{or} \ \ \displaystyle\int_{-\infty}^x{P\{X=x\}\mathrm{d}x} F(x)=P{X≤x}=xi≤x∑P{X=xi} or ∫−∞xP{X=x}dx
- P { x 1 < X ≤ x 2 } = P { X ≤ x 2 } − P { X ≤ x 1 } = F ( x 2 ) − F ( x 1 ) P\{x_1<X \leq x_2\}=P\{X \leq x_2\}-P\{X \leq x_1\}=F(x_2)-F(x_1) P{x1<X≤x2}=P{X≤x2}−P{X≤x1}=F(x2)−F(x1)
- 分布函数的性质:
- F ( x ) F(x) F(x) 单调不减
- 0 ≤ F ( x ) ≤ 1 0 \leq F(x) \leq 1 0≤F(x)≤1,且满足 lim a → − ∞ F ( a ) = 0 \displaystyle\lim_{a \to -\infty}{F(a)}=0 a→−∞limF(a)=0 和 lim b → + ∞ F ( b ) = 1 \displaystyle\lim_{b \to +\infty}{F(b)}=1 b→+∞limF(b)=1
- F ( x + 0 ) = F ( x ) F(x+0)=F(x) F(x+0)=F(x),即 F ( x ) F(x) F(x) 右连续
连续型随机变量的密度函数
- 对于随机变量 X X X,其分布函数为 F ( x ) F(x) F(x),若存在一个非负的实函数 f ( x ) f(x) f(x),使得对任意实数 x x x,有 F ( x ) = ∫ − ∞ x f ( t ) d t F(x)=\displaystyle\int_{-\infty}^x{f(t)\mathrm{d}t} F(x)=∫−∞xf(t)dt,则称 f ( x ) f(x) f(x) 为连续型随机变量 X X X 的密度函数
- 密度函数的性质:
- f ( x ) ≥ 0 f(x) \ge 0 f(x)≥0
- ∫ − ∞ + ∞ f ( t ) d t = 1 \displaystyle\int_{-\infty}^{+\infty}{f(t)\mathrm{d}t}=1 ∫−∞+∞f(t)dt=1
- 对于任意实数 x 1 < x 2 x_1<x_2 x1<x2,有 P { x 1 < X ≤ x 2 } = F ( x 2 ) − F ( x 1 ) = ∫ x 1 x 2 f ( t ) d t P\{x_1<X \leq x_2\}=F(x_2)-F(x_1)=\displaystyle\int_{x_1}^{x_2}{f(t)\mathrm{d}t} P{x1<X≤x2}=F(x2)−F(x1)=∫x1x2f(t)dt
- 若 f ( x ) f(x) f(x) 在 x = x 0 x=x_0 x=x0 处连续,则 F ′ ( x ) = f ( x ) F'(x)=f(x) F′(x)=f(x)
- 由 F ( x ) F(x) F(x) 的连续性可以推出 P { X = a } = 0 P\{X=a\}=0 P{X=a}=0,即连续型随机变量取任一定值的概率为零
均匀分布
- 设随机变量 X X X 具有密度函数 f ( x ) = { 1 b − a , x ∈ ( a , b ) 0 , o t h e r w i s e f(x)=\begin{cases}\dfrac{1}{b-a}, x \in (a,b) \\ 0, otherwise\end{cases} f(x)=⎩⎨⎧b−a1,x∈(a,b)0,otherwise,则称 X X X 服从区间 ( a , b ) (a,b) (a,b) 上的均匀分布,记作 X ∼ U ( a , b ) X \sim U(a,b) X∼U(a,b)
- 均匀分布的分布函数: F ( x ) = { 0 , x < a x − a b − a , a ≤ x < b 1 , x ≥ b F(x)=\begin{cases}0, &x<a \\ \dfrac{x-a}{b-a}, &a \leq x<b \\ 1, &x \ge b\end{cases} F(x)=⎩⎪⎪⎨⎪⎪⎧0,b−ax−a,1,x<aa≤x<bx≥b
正态分布
- 设随机变量 X X X 具有密度函数 f ( x ) = 1 2 π σ exp [ − ( x − μ ) 2 2 σ 2 ] f(x)=\dfrac{1}{\sqrt{2\pi}\sigma}\exp\left[-\dfrac{(x-\mu)^2}{2\sigma^2}\right] f(x)=2πσ1exp[−2σ2(x−μ)2],其中 σ > 0 \sigma>0 σ>0 且 ∣ μ ∣ < + ∞ |\mu|<+\infty ∣μ∣<+∞,则称 X X X 服从参数为 ( μ , σ ) (\mu,\sigma) (μ,σ) 的正态分布,记作 X ∼ N ( μ , σ 2 ) X \sim N(\mu,\sigma^2) X∼N(μ,σ2)
- 正态分布密度函数的性质:
- f ( x ) f(x) f(x) 关于 x = μ x=\mu x=μ 对称
- max ∣ x ∣ < + ∞ f ( x ) = f ( μ ) = 1 2 π σ \displaystyle\max_{|x|<+\infty}{f(x)}=f(\mu)=\dfrac{1}{\sqrt{2\pi}\sigma} ∣x∣<+∞maxf(x)=f(μ)=2πσ1
- lim ∣ x − μ ∣ → + ∞ f ( x ) = 0 \displaystyle\lim_{|x-\mu| \to +\infty}{f(x)}=0 ∣x−μ∣→+∞limf(x)=0
- 标准正态分布
Z
∼
N
(
0
,
1
)
Z \sim N(0,1)
Z∼N(0,1),密度函数
φ
(
x
)
=
1
2
π
exp
(
−
x
2
2
)
\varphi(x)=\dfrac{1}{\sqrt{2\pi}}\exp\left(-\dfrac{x^2}{2}\right)
φ(x)=2π1exp(−2x2),分布函数
Φ
(
x
)
=
1
2
π
exp
(
−
x
2
2
)
\Phi(x)=\dfrac{1}{\sqrt{2\pi}}\exp\left(-\dfrac{x^2}{2}\right)
Φ(x)=2π1exp(−2x2)
- 根据对称性, Φ ( − x ) = P { Z ≤ − x } = P { Z ≥ x } = 1 − Φ ( x ) \Phi(-x)=P\{Z \leq -x\}=P\{Z \ge x\}=1-\Phi(x) Φ(−x)=P{Z≤−x}=P{Z≥x}=1−Φ(x)
- 对于一般正态分布 X ∼ N ( μ , σ 2 ) X \sim N(\mu,\sigma^2) X∼N(μ,σ2), P { a < X < b } = Φ ( b − μ σ ) − Φ ( a − μ σ ) P\{a<X<b\}=\Phi\left(\dfrac{b-\mu}{\sigma}\right)-\Phi\left(\dfrac{a-\mu}{\sigma}\right) P{a<X<b}=Φ(σb−μ)−Φ(σa−μ)
- 若 z α z_\alpha zα 满足 Φ ( z α ) = 1 − α \Phi(z_\alpha)=1-\alpha Φ(zα)=1−α,称 z α z_\alpha zα 为标准正态分布的上 α \alpha α 分位数
指数分布
- 设随机变量 X X X 具有密度函数 f ( x ) = { λ e − λ x , x > 0 0 , x ≤ 0 f(x)=\begin{cases}\lambda e^{-\lambda x}, &x>0 \\ 0, &x \leq 0\end{cases} f(x)={λe−λx,0,x>0x≤0,其中 λ > 0 \lambda>0 λ>0,则称 X X X 服从参数为 λ \lambda λ 的指数分布,记作 X ∼ E ( λ ) X \sim E(\lambda) X∼E(λ)
- 指数分布的分布函数: F ( x ) = { 1 − e − λ x , x > 0 0 , x ≤ 0 F(x)=\begin{cases}1-e^{-\lambda x}, &x>0 \\ 0, &x \leq 0\end{cases} F(x)={1−e−λx,0,x>0x≤0
- 指数分布具有无记忆性: P { X > t 0 + t } = P { X > t 0 } ⋅ P { X > t } P\{X>t_0+t\}=P\{X>t_0\} \cdot P\{X>t\} P{X>t0+t}=P{X>t0}⋅P{X>t}
随机变量函数的分布
- 设 X X X 为一连续型随机变量,其密度函数为 f X ( x ) f_X(x) fX(x),随机变量 Y = g ( X ) Y=g(X) Y=g(X)。若函数 y = g ( x ) y=g(x) y=g(x) 为一严格单调递增(或单调递减)函数,且处处可微,记其反函数为 x = h ( y ) x=h(y) x=h(y),则 Y Y Y 的密度函数为 f Y ( y ) = { f X ( h ( y ) ) ⋅ ∣ h ′ ( y ) ∣ , y ∈ D 0 , y ∉ D f_Y(y)=\begin{cases}f_X(h(y)) \cdot |h'(y)|, &y \in D \\ 0, &y \not\in D\end{cases} fY(y)={fX(h(y))⋅∣h′(y)∣,0,y∈Dy∈D,其中 D D D 为函数 y = g ( x ) y=g(x) y=g(x) 的值域
多元随机变量及其分布
二元离散型随机变量
- 设二元离散型随机变量 ( X , Y ) (X,Y) (X,Y) 的可能取值为 ( x i , y j ) (x_i,y_j) (xi,yj),其中 i , j ∈ N + i,j \in \mathbb{N}^+ i,j∈N+,称 P { X = x i , Y = y j } = p i j P\{X=x_i, Y=y_j\}=p_{ij} P{X=xi,Y=yj}=pij 为 ( X , Y ) (X,Y) (X,Y) 的联合分布律
- 二元离散型随机变量的边际分布:
- P { X = x i } = P ( ⋃ j = 1 + ∞ { X = x i , Y = y j } ) = ∑ j = 1 + ∞ p i j ≜ p i ⋅ P\{X=x_i\}=P\left(\displaystyle\bigcup_{j=1}^{+\infty}{\{X=x_i, Y=y_j\}}\right)=\displaystyle\sum_{j=1}^{+\infty}{p_{ij}} \triangleq p_{i \cdot} P{X=xi}=P(j=1⋃+∞{X=xi,Y=yj})=j=1∑+∞pij≜pi⋅
- P { Y = y j } = P ( ⋃ i = 1 + ∞ { X = x i , Y = y j } ) = ∑ i = 1 + ∞ p i j ≜ p ⋅ j P\{Y=y_j\}=P\left(\displaystyle\bigcup_{i=1}^{+\infty}{\{X=x_i, Y=y_j\}}\right)=\displaystyle\sum_{i=1}^{+\infty}{p_{ij}} \triangleq p_{\cdot j} P{Y=yj}=P(i=1⋃+∞{X=xi,Y=yj})=i=1∑+∞pij≜p⋅j
- 二元离散型随机变量的条件分布:
- P { X = x i ∣ Y = y j } = P { X = x i , Y = y j } P { Y = y j } = p i j p ⋅ j P\{X=x_i|Y=y_j\}=\dfrac{P\{X=x_i, Y=y_j\}}{P\{Y=y_j\}}=\dfrac{p_{ij}}{p_{\cdot j}} P{X=xi∣Y=yj}=P{Y=yj}P{X=xi,Y=yj}=p⋅jpij
- P { Y = y j ∣ X = x i } = P { X = x i , Y = y j } P { X = x i } = p i j p i ⋅ P\{Y=y_j|X=x_i\}=\dfrac{P\{X=x_i, Y=y_j\}}{P\{X=x_i\}}=\dfrac{p_{ij}}{p_{i \cdot}} P{Y=yj∣X=xi}=P{X=xi}P{X=xi,Y=yj}=pi⋅pij
二元随机变量的分布函数
- 二元随机变量的联合分布函数:设二元随机变量 ( X , Y ) (X,Y) (X,Y),对于任意实数 x , y x, y x,y,称函数 F ( x , y ) = P { X ≤ x , Y ≤ y } F(x,y)=P\{X \leq x, Y \leq y\} F(x,y)=P{X≤x,Y≤y} 为 ( X , Y ) (X,Y) (X,Y) 的联合分布函数
- 二元联合分布函数的性质:
- 对于固定的 x = x 0 x=x_0 x=x0, F ( x 0 , y ) F(x_0, y) F(x0,y) 关于 y y y 单调不减
- 对于固定的 y = y 0 y=y_0 y=y0, F ( x , y 0 ) F(x, y_0) F(x,y0) 关于 x x x 单调不减
- 0 ≤ F ( x , y ) ≤ 1 0 \leq F(x,y) \leq 1 0≤F(x,y)≤1
- F ( x , − ∞ ) = F ( − ∞ , y ) = F ( − ∞ , − ∞ ) = 0 , F ( + ∞ , + ∞ ) = 1 F(x, -\infty)=F(-\infty, y)=F(-\infty, -\infty)=0, F(+\infty, +\infty)=1 F(x,−∞)=F(−∞,y)=F(−∞,−∞)=0,F(+∞,+∞)=1
- F ( x + 0 , y ) = F ( x , y ) F(x+0, y)=F(x, y) F(x+0,y)=F(x,y),即 F ( x , y ) F(x,y) F(x,y) 关于 x x x 右连续
- F ( x , y + 0 ) = F ( x , y ) F(x, y+0)=F(x, y) F(x,y+0)=F(x,y),即 F ( x , y ) F(x,y) F(x,y) 关于 y y y 右连续
- 对于实数 x 1 < x 2 x_1<x_2 x1<x2 和 y 1 < y 2 y_1<y_2 y1<y2, P { x 1 < X ≤ x 2 , y 1 < Y ≤ y 2 } = F ( x 2 , y 2 ) − F ( x 1 , y 2 ) − F ( x 2 , y 1 ) + F ( x 1 , y 1 ) P\{x_1<X \leq x_2, y_1<Y \leq y_2\}=F(x_2,y_2)-F(x_1,y_2)-F(x_2,y_1)+F(x_1,y_1) P{x1<X≤x2,y1<Y≤y2}=F(x2,y2)−F(x1,y2)−F(x2,y1)+F(x1,y1)
- 二元边际分布函数:
- F X ( x ) = P { X ≤ x } = P { X ≤ x , Y ≤ + ∞ } = F ( x , + ∞ ) F_X(x)=P\{X \leq x\}=P\{X \leq x, Y \leq +\infty\}=F(x, +\infty) FX(x)=P{X≤x}=P{X≤x,Y≤+∞}=F(x,+∞)
- F Y ( y ) = P { Y ≤ y } = P { X ≤ + ∞ , Y ≤ y } = F ( + ∞ , y ) F_Y(y)=P\{Y \leq y\}=P\{X \leq +\infty, Y \leq y\}=F(+\infty, y) FY(y)=P{Y≤y}=P{X≤+∞,Y≤y}=F(+∞,y)
- 二元条件分布函数: F Y ∣ X ( y ∣ x i ) = P { Y ≤ y ∣ X = x i } o r lim δ → 0 + P { Y ≤ y ∣ x i < X ≤ x i + δ } F_{Y|X}(y|x_i)=P\{Y \leq y|X=x_i\} \ \ \mathrm{or} \ \ \displaystyle\lim_{\delta \to 0^+}{P\{Y \leq y|x_i<X \leq x_i+\delta\}} FY∣X(y∣xi)=P{Y≤y∣X=xi} or δ→0+limP{Y≤y∣xi<X≤xi+δ}
二元连续型随机变量
- 设二元随机变量 ( X , Y ) (X,Y) (X,Y) 的联合分布函数为 F ( x , y ) F(x,y) F(x,y),若存在二元函数 f ( x , y ) ≥ 0 f(x,y) \ge 0 f(x,y)≥0,对任意实数 x , y x,y x,y 有 F ( x , y ) = ∫ − ∞ x ∫ − ∞ y f ( u , v ) d u d v F(x,y)=\displaystyle\int_{-\infty}^x\displaystyle\int_{-\infty}^y{f(u,v)\mathrm{d}u\mathrm{d}v} F(x,y)=∫−∞x∫−∞yf(u,v)dudv,则称 f ( x , y ) f(x,y) f(x,y) 为 ( X , Y ) (X,Y) (X,Y) 的联合密度函数
- 联合密度函数的性质:
- f ( x , y ) ≥ 0 f(x,y) \ge 0 f(x,y)≥0
- ∫ − ∞ + ∞ ∫ − ∞ + ∞ f ( u , v ) d u d v = F ( + ∞ , + ∞ ) = 1 \displaystyle\int_{-\infty}^{+\infty}\displaystyle\int_{-\infty}^{+\infty}{f(u,v)\mathrm{d}u\mathrm{d}v}=F(+\infty,+\infty)=1 ∫−∞+∞∫−∞+∞f(u,v)dudv=F(+∞,+∞)=1
- 若 F ( x , y ) F(x,y) F(x,y) 在 ( x , y ) (x,y) (x,y) 处连续,则 ∂ 2 F ( x , y ) ∂ x ∂ y = f ( x , y ) \dfrac{\partial^2 F(x,y)}{\partial x \partial y}=f(x,y) ∂x∂y∂2F(x,y)=f(x,y)
- ( X , Y ) (X,Y) (X,Y) 落入 x O y xOy xOy 平面任一区域 D D D 的概率为 P { ( X , Y ) ∈ D } = ∬ D f ( x , y ) d x d y P\{(X,Y) \in D\}=\displaystyle\iint_D{f(x,y)\mathrm{d}x\mathrm{d}y} P{(X,Y)∈D}=∬Df(x,y)dxdy
- 二元连续型随机变量的边际分布:
- F X ( x ) = P { X ≤ x } = P { X ≤ x , Y ≤ + ∞ } = ∫ − ∞ x [ ∫ − ∞ + ∞ f ( x , y ) d y ] d x F_X(x)=P\{X \leq x\}=P\{X \leq x, Y \leq +\infty\}=\displaystyle\int_{-\infty}^{x}{\left[\displaystyle\int_{-\infty}^{+\infty}{f(x,y)\mathrm{d}y}\right]\mathrm{d}x} FX(x)=P{X≤x}=P{X≤x,Y≤+∞}=∫−∞x[∫−∞+∞f(x,y)dy]dx
- f X ( x ) = ∫ − ∞ + ∞ f ( x , y ) d y f_X(x)=\displaystyle\int_{-\infty}^{+\infty}{f(x,y)\mathrm{d}y} fX(x)=∫−∞+∞f(x,y)dy
- F Y ( y ) = P { Y ≤ y } = P { X ≤ + ∞ , Y ≤ y } = ∫ − ∞ y [ ∫ − ∞ + ∞ f ( x , y ) d x ] d y F_Y(y)=P\{Y \leq y\}=P\{X \leq +\infty, Y \leq y\}=\displaystyle\int_{-\infty}^{y}{\left[\displaystyle\int_{-\infty}^{+\infty}{f(x,y)\mathrm{d}x}\right]\mathrm{d}y} FY(y)=P{Y≤y}=P{X≤+∞,Y≤y}=∫−∞y[∫−∞+∞f(x,y)dx]dy
- f Y ( y ) = ∫ − ∞ + ∞ f ( x , y ) d x f_Y(y)=\displaystyle\int_{-\infty}^{+\infty}{f(x,y)\mathrm{d}x} fY(y)=∫−∞+∞f(x,y)dx
- 条件密度函数:
- f Y ∣ X ( y ∣ x ) = f ( x , y ) f X ( x ) , f X ( x ) ≠ 0 f_{Y|X}(y|x)=\dfrac{f(x,y)}{f_X(x)}, f_X(x) \ne 0 fY∣X(y∣x)=fX(x)f(x,y),fX(x)=0
- f X ∣ Y ( x ∣ y ) = f ( x , y ) f Y ( y ) , f Y ( y ) ≠ 0 f_{X|Y}(x|y)=\dfrac{f(x,y)}{f_Y(y)}, f_Y(y) \ne 0 fX∣Y(x∣y)=fY(y)f(x,y),fY(y)=0
- 设二元随机变量
(
X
,
Y
)
(X,Y)
(X,Y) 具有联合密度函数
f
(
x
,
y
)
=
1
2
π
σ
1
σ
2
1
−
ρ
2
exp
{
−
1
2
(
1
−
ρ
2
)
[
(
x
−
μ
1
)
2
σ
1
2
−
2
ρ
(
x
−
μ
1
)
(
y
−
μ
2
)
σ
1
σ
2
+
(
y
−
μ
2
)
2
σ
2
2
]
}
f(x,y)=\dfrac{1}{2\pi\sigma_1\sigma_2\sqrt{1-\rho^2}}\exp\left\{-\dfrac{1}{2(1-\rho^2)}\left[\dfrac{(x-\mu_1)^2}{\sigma_1^2}-2\rho\dfrac{(x-\mu_1)(y-\mu_2)}{\sigma_1\sigma_2}+\dfrac{(y-\mu_2)^2}{\sigma_2^2}\right]\right\}
f(x,y)=2πσ1σ21−ρ21exp{−2(1−ρ2)1[σ12(x−μ1)2−2ρσ1σ2(x−μ1)(y−μ2)+σ22(y−μ2)2]},其中
∣
μ
1
∣
,
∣
μ
2
∣
<
+
∞
|\mu_1|,|\mu_2|<+\infty
∣μ1∣,∣μ2∣<+∞,
σ
1
,
σ
2
>
0
\sigma_1,\sigma_2>0
σ1,σ2>0,
∣
ρ
∣
<
1
|\rho|<1
∣ρ∣<1,则称
(
X
,
Y
)
(X,Y)
(X,Y) 服从参数为
(
μ
1
,
μ
2
,
σ
1
2
,
σ
2
2
,
ρ
)
(\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,\rho)
(μ1,μ2,σ12,σ22,ρ) 的二元正态分布,记为
(
X
,
Y
)
∼
N
(
μ
1
,
μ
2
,
σ
1
2
,
σ
2
2
,
ρ
)
(X,Y) \sim N(\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,\rho)
(X,Y)∼N(μ1,μ2,σ12,σ22,ρ)
- X , Y X,Y X,Y 的边际分布也是正态分布: X ∼ N ( μ 1 , σ 1 2 ) , Y ∼ N ( μ 2 , σ 2 2 ) X \sim N(\mu_1,\sigma_1^2), Y \sim N(\mu_2,\sigma_2^2) X∼N(μ1,σ12),Y∼N(μ2,σ22)
- 当给定 { X = x } \{X=x\} {X=x} 的条件下, Y Y Y 的条件分布也是正态分布: Y ∣ X = x ∼ N ( μ 2 + ρ σ 1 σ 2 ( x − μ 1 ) , ( 1 − ρ 2 ) σ 2 2 ) Y|X=x \sim N\left(\mu_2+\rho\dfrac{\sigma_1}{\sigma_2}(x-\mu_1),(1-\rho^2)\sigma_2^2\right) Y∣X=x∼N(μ2+ρσ2σ1(x−μ1),(1−ρ2)σ22)
- 当给定 { Y = y } \{Y=y\} {Y=y} 的条件下, X X X 的条件分布也是正态分布: X ∣ Y = y ∼ N ( μ 1 + ρ σ 1 σ 2 ( y − μ 2 ) , ( 1 − ρ 2 ) σ 1 2 ) X|Y=y \sim N\left(\mu_1+\rho\dfrac{\sigma_1}{\sigma_2}(y-\mu_2),(1-\rho^2)\sigma_1^2\right) X∣Y=y∼N(μ1+ρσ2σ1(y−μ2),(1−ρ2)σ12)
随机变量的独立性
- 对于任意两个实数集合 D 1 , D 2 D_1,D2 D1,D2,若 P { X ∈ D 1 , Y ∈ D 2 } = P { X ∈ D 1 } ⋅ P { Y ∈ D 2 } P\{X \in D_1,Y \in D_2\}=P\{X \in D_1\} \cdot P\{Y \in D_2\} P{X∈D1,Y∈D2}=P{X∈D1}⋅P{Y∈D2},则称随机变量 X , Y X,Y X,Y 相互独立
- 当 F ( x , y ) = F X ( x ) ⋅ F Y ( y ) F(x,y)=F_X(x) \cdot F_Y(y) F(x,y)=FX(x)⋅FY(y) 时, X , Y X,Y X,Y 相互独立
- 对于连续型随机变量,被积的密度函数在除了面积为零的区域外处处相等,即 f ( x , y ) = f X ( x ) ⋅ f Y ( y ) f(x,y)=f_X(x) \cdot f_Y(y) f(x,y)=fX(x)⋅fY(y),为相互独立的等价定义
- 二元连续型随机变量 X , Y X,Y X,Y 相互独立的充要条件是 X , Y X,Y X,Y 的联合密度函数 f ( x , y ) f(x,y) f(x,y) 几乎处处可写成关于 x x x 的函数 m ( x ) m(x) m(x) 和关于 y y y 的函数 n ( y ) n(y) n(y),即 f ( x , y ) = m ( x ) ⋅ n ( y ) , ∣ x ∣ < + ∞ , ∣ y ∣ < + ∞ , f ( x , y ) ≠ 0 f(x,y)=m(x) \cdot n(y), |x|<+\infty, |y|<+\infty, f(x,y) \ne 0 f(x,y)=m(x)⋅n(y),∣x∣<+∞,∣y∣<+∞,f(x,y)=0
二元随机变量函数的分布
-
Z
=
X
+
Y
Z=X+Y
Z=X+Y:
- f Z ( z ) = ∫ − ∞ + ∞ f ( x , z − x ) d x f_Z(z)=\displaystyle\int_{-\infty}^{+\infty}{f(x,z-x)\mathrm{d}x} fZ(z)=∫−∞+∞f(x,z−x)dx
- f Z ( z ) = ∫ − ∞ + ∞ f ( z − y , y ) d y f_Z(z)=\displaystyle\int_{-\infty}^{+\infty}{f(z-y,y)\mathrm{d}y} fZ(z)=∫−∞+∞f(z−y,y)dy
-
M
=
max
(
X
,
Y
)
M=\max(X,Y)
M=max(X,Y):
- F M ( t ) = P { max ( X , Y ) ≤ t } = P { X ≤ t , Y ≤ t } = F ( t , t ) F_M(t)=P\{\max(X,Y) \leq t\}=P\{X \leq t, Y \leq t\}=F(t,t) FM(t)=P{max(X,Y)≤t}=P{X≤t,Y≤t}=F(t,t)
- 若 X , Y X,Y X,Y 相互独立,则 F M ( t ) = F x ( t ) ⋅ F Y ( t ) F_M(t)=F_x(t) \cdot F_Y(t) FM(t)=Fx(t)⋅FY(t)
-
N
=
min
(
X
,
Y
)
N=\min(X,Y)
N=min(X,Y):
- F N ( t ) = P { min ( X , Y ) ≤ t } = 1 − P { min ( X , Y ) > t } = 1 − P { X > t , Y > t } F_N(t)=P\{\min(X,Y) \leq t\}=1-P\{\min(X,Y)>t\}=1-P\{X>t, Y>t\} FN(t)=P{min(X,Y)≤t}=1−P{min(X,Y)>t}=1−P{X>t,Y>t}
- 若 X , Y X,Y X,Y 相互独立,则 F N ( t ) = 1 − [ 1 − F X ( t ) ] ⋅ [ 1 − F Y ( t ) ] F_N(t)=1-[1-F_X(t)] \cdot [1-F_Y(t)] FN(t)=1−[1−FX(t)]⋅[1−FY(t)]
随机变量的数字特征
期望
-
E
(
X
)
=
∑
i
=
1
+
∞
x
i
p
i
o
r
∫
−
∞
+
∞
x
f
(
x
)
d
x
E(X)=\displaystyle\sum_{i=1}^{+\infty}{x_ip_i} \ \ \mathrm{or} \ \ \displaystyle\int_{-\infty}^{+\infty}{xf(x)\mathrm{d}x}
E(X)=i=1∑+∞xipi or ∫−∞+∞xf(x)dx
- 泊松分布的期望: E ( X ) = ∑ k = 0 + ∞ k ⋅ ( e − λ ⋅ λ k k ! ) = λ e − λ ∑ k = 1 + ∞ λ k − 1 ( k − 1 ) ! = λ e − λ ⋅ e λ = λ E(X)=\displaystyle\sum_{k=0}^{+\infty}{k \cdot \left(e^{-\lambda} \cdot \dfrac{\lambda^k}{k!}\right)}=\lambda e^{-\lambda}\displaystyle\sum_{k=1}^{+\infty}{\dfrac{\lambda^{k-1}}{(k-1)!}}=\lambda e^{-\lambda} \cdot e^{\lambda}=\lambda E(X)=k=0∑+∞k⋅(e−λ⋅k!λk)=λe−λk=1∑+∞(k−1)!λk−1=λe−λ⋅eλ=λ
- 指数分布的期望: E ( X ) = ∫ 0 + ∞ x ⋅ λ e − λ x ⋅ d x = x ⋅ ( − e − λ x ) ∣ 0 + ∞ − ∫ 0 + ∞ − e − λ x d x = − 1 λ e − λ x ∣ 0 + ∞ = 1 λ E(X)=\displaystyle\int_0^{+\infty}{x \cdot \lambda e^{-\lambda x} \cdot \mathrm{d}x}=\left.x \cdot (-e^{-\lambda x})\right|_0^{+\infty}-\displaystyle\int_0^{+\infty}{-e^{-\lambda x}\mathrm{d}x}=\left.-\dfrac1\lambda e^{-\lambda x}\right|_0^{+\infty}=\dfrac1\lambda E(X)=∫0+∞x⋅λe−λx⋅dx=x⋅(−e−λx)∣∣0+∞−∫0+∞−e−λxdx=−λ1e−λx∣∣∣∣0+∞=λ1
- 标准正态分布的期望: E ( Z ) = ∫ − ∞ + ∞ z ⋅ φ ( z ) d z = ∵ f ( − z ) = − z φ ( z ) = − f ( z ) 0 E(Z)=\displaystyle\int_{-\infty}^{+\infty}{z \cdot \varphi(z)\mathrm{d}z} \xlongequal{\because f(-z)=-z\varphi(z)=-f(z)} 0 E(Z)=∫−∞+∞z⋅φ(z)dz∵f(−z)=−zφ(z)=−f(z)0
- 随机变量函数的期望: E ( g ( X ) ) = ∑ i = 1 + ∞ g ( x i ) p i o r ∫ − ∞ + ∞ g ( x ) f ( x ) d x E(g(X))=\displaystyle\sum_{i=1}^{+\infty}{g(x_i)p_i} \ \ \mathrm{or} \ \ \displaystyle\int_{-\infty}^{+\infty}{g(x)f(x)\mathrm{d}x} E(g(X))=i=1∑+∞g(xi)pi or ∫−∞+∞g(x)f(x)dx
- 二元随机变量函数的期望: E ( h ( X , Y ) ) = ∑ i = 1 + ∞ ∑ j = 1 + ∞ h ( x i , y i ) p i j o r ∫ − ∞ + ∞ ∫ − ∞ + ∞ h ( x , y ) f ( x , y ) d x d y E(h(X,Y))=\displaystyle\sum_{i=1}^{+\infty}\displaystyle\sum_{j=1}^{+\infty}{h(x_i, y_i)p_{ij}} \ \ \mathrm{or} \ \ \displaystyle\int_{-\infty}^{+\infty}\displaystyle\int_{-\infty}^{+\infty}{h(x,y)f(x,y)\mathrm{d}x\mathrm{d}y} E(h(X,Y))=i=1∑+∞j=1∑+∞h(xi,yi)pij or ∫−∞+∞∫−∞+∞h(x,y)f(x,y)dxdy
- 期望的性质:
E
(
c
0
+
∑
i
=
1
n
c
i
X
i
)
=
c
0
+
∑
i
=
1
n
c
i
E
(
X
i
)
E\left(c_0+\displaystyle\sum_{i=1}^{n}{c_iX_i}\right)=c_0+\displaystyle\sum_{i=1}^{n}{c_iE(X_i)}
E(c0+i=1∑nciXi)=c0+i=1∑nciE(Xi)
- 正态分布的期望: X ∼ N ( μ , σ 2 ) ⇒ Z = X − μ σ ∼ N ( 0 , 1 ) E ( X ) = E ( σ Z + μ ) = σ E ( Z ) + μ = μ X \sim N(\mu, \sigma^2) \xRightarrow{Z=\frac{X-\mu}{\sigma} \sim N(0,1)} E(X)=E(\sigma Z+\mu)=\sigma E(Z)+\mu=\mu X∼N(μ,σ2)Z=σX−μ∼N(0,1)E(X)=E(σZ+μ)=σE(Z)+μ=μ
- 二项分布的期望: E ( X ) = E ( ∑ i = 1 n X i ) = ∑ i = 1 n E ( X i ) = ∑ i = 1 n p = n p E(X)=E\left(\displaystyle\sum_{i=1}^{n}{X_i}\right)=\displaystyle\sum_{i=1}^{n}{E(X_i)}=\displaystyle\sum_{i=1}^{n}{p}=np E(X)=E(i=1∑nXi)=i=1∑nE(Xi)=i=1∑np=np
- 对于独立变量: E ( ∏ i = 1 n X i ) = ∏ i = 1 n E ( X i ) E\left(\displaystyle\prod_{i=1}^{n}{X_i}\right)=\displaystyle\prod_{i=1}^{n}{E(X_i)} E(i=1∏nXi)=i=1∏nE(Xi)
方差
-
V
a
r
(
X
)
=
D
(
X
)
=
E
[
(
X
−
E
(
X
)
)
2
]
\mathrm{Var}(X)=D(X)=E[(X-E(X))^2]
Var(X)=D(X)=E[(X−E(X))2]
- 标准差: σ ( X ) = D ( X ) \sigma(X)=\sqrt{D(X)} σ(X)=D(X)
- D ( X ) = E [ X 2 − 2 X ⋅ E ( X ) + E 2 ( X ) ] = E ( X 2 ) − E ( X ) ⋅ 2 E ( X ) + E 2 ( X ) = E ( X 2 ) − E 2 ( X ) D(X)=E[X^2-2X \cdot E(X)+E^2(X)]=E(X^2)-E(X) \cdot 2E(X)+E^2(X)=E(X^2)-E^2(X) D(X)=E[X2−2X⋅E(X)+E2(X)]=E(X2)−E(X)⋅2E(X)+E2(X)=E(X2)−E2(X)
- 泊松分布的方差: E ( X 2 ) = ∑ k = 0 + ∞ k 2 ⋅ ( e − λ ⋅ λ k k ! ) = λ e − λ ∑ k = 1 + ∞ [ ( k − 1 ) + 1 ] ⋅ λ k − 1 ( k − 1 ) ! = λ e − λ [ λ ∑ k = 2 + ∞ λ k − 2 ( k − 2 ) ! + ∑ k = 1 + ∞ λ k − 1 ( k − 1 ) ! ] = λ e − λ ( λ e λ + e λ ) = λ 2 + λ ⇒ E ( X ) = λ D ( X ) = λ E(X^2)=\displaystyle\sum_{k=0}^{+\infty}{k^2 \cdot \left(e^{-\lambda} \cdot \dfrac{\lambda^k}{k!}\right)}=\lambda e^{-\lambda}\displaystyle\sum_{k=1}^{+\infty}{[(k-1)+1] \cdot \dfrac{\lambda^{k-1}}{(k-1)!}}=\lambda e^{-\lambda}\left[\lambda\displaystyle\sum_{k=2}^{+\infty}{\dfrac{\lambda^{k-2}}{(k-2)!}}+\displaystyle\sum_{k=1}^{+\infty}{\dfrac{\lambda^{k-1}}{(k-1)!}}\right]=\lambda e^{-\lambda}\left(\lambda e^{\lambda}+e^{\lambda}\right)=\lambda^2+\lambda \xRightarrow{E(X)=\lambda} D(X)=\lambda E(X2)=k=0∑+∞k2⋅(e−λ⋅k!λk)=λe−λk=1∑+∞[(k−1)+1]⋅(k−1)!λk−1=λe−λ[λk=2∑+∞(k−2)!λk−2+k=1∑+∞(k−1)!λk−1]=λe−λ(λeλ+eλ)=λ2+λE(X)=λD(X)=λ
- 指数分布的方差: E ( X 2 ) = ∫ 0 + ∞ x 2 ⋅ λ e − λ x ⋅ d x = x 2 ⋅ ( − e − λ x ) ∣ 0 + ∞ − ∫ 0 + ∞ 2 x ⋅ ( − e − λ x ) d x = 2 ∫ 0 + ∞ x e − λ x d x = 2 λ E ( X ) ⇒ E ( X ) = 1 λ D ( X ) = 1 λ 2 E(X^2)=\displaystyle\int_0^{+\infty}{x^2 \cdot \lambda e^{-\lambda x} \cdot \mathrm{d}x}=\left.x^2 \cdot (-e^{-\lambda x})\right|_0^{+\infty}-\displaystyle\int_0^{+\infty}{2x \cdot (-e^{-\lambda x})\mathrm{d}x}=2\displaystyle\int_0^{+\infty}{xe^{-\lambda x}\mathrm{d}x}=\dfrac2\lambda E(X) \xRightarrow{E(X)=\frac1\lambda} D(X)=\dfrac1{\lambda^2} E(X2)=∫0+∞x2⋅λe−λx⋅dx=x2⋅(−e−λx)∣∣0+∞−∫0+∞2x⋅(−e−λx)dx=2∫0+∞xe−λxdx=λ2E(X)E(X)=λ1D(X)=λ21
- 标准正态分布的方差: D ( X ) = 1 D(X)=1 D(X)=1
- 方差的性质:
D
(
c
0
+
∑
i
=
1
n
c
i
X
i
)
=
∑
i
=
1
n
c
i
2
D
(
X
i
)
D\left(c_0+\displaystyle\sum_{i=1}^{n}{c_iX_i}\right)=\displaystyle\sum_{i=1}^{n}{c_i^2D(X_i)}
D(c0+i=1∑nciXi)=i=1∑nci2D(Xi)
- 二项分布的方差: D ( X ) = D ( ∑ i = 1 n X i ) = ∑ i = 1 n D ( X i ) = ∑ i = 1 n p ( 1 − p ) = n p ( 1 − p ) D(X)=D\left(\displaystyle\sum_{i=1}^{n}{X_i}\right)=\displaystyle\sum_{i=1}^{n}{D(X_i)}=\displaystyle\sum_{i=1}^{n}{p(1-p)}=np(1-p) D(X)=D(i=1∑nXi)=i=1∑nD(Xi)=i=1∑np(1−p)=np(1−p)
协方差
-
C
o
v
(
X
,
Y
)
=
E
[
(
X
−
E
(
X
)
)
(
Y
−
E
(
Y
)
)
]
=
E
(
X
Y
)
−
E
(
X
)
E
(
Y
)
\mathrm{Cov}(X,Y)=E[(X-E(X))(Y-E(Y))]=E(XY)-E(X)E(Y)
Cov(X,Y)=E[(X−E(X))(Y−E(Y))]=E(XY)−E(X)E(Y)
- 离散型: C o v ( X , Y ) = ∑ i = 1 + ∞ ∑ j = 1 + ∞ ( x i − E ( X ) ) ( y j − E ( Y ) ) p i j \mathrm{Cov}(X,Y)=\displaystyle\sum_{i=1}^{+\infty}\displaystyle\sum_{j=1}^{+\infty}{(x_i-E(X))(y_j-E(Y))p_{ij}} Cov(X,Y)=i=1∑+∞j=1∑+∞(xi−E(X))(yj−E(Y))pij
- 连续型: C o v ( X , Y ) = ∫ − ∞ + ∞ ∫ − ∞ + ∞ ( x − E ( X ) ) ( y − E ( Y ) ) f ( x , y ) d x d y \mathrm{Cov}(X,Y)=\displaystyle\int_{-\infty}^{+\infty}\displaystyle\int_{-\infty}^{+\infty}{(x-E(X))(y-E(Y))f(x,y)\mathrm{d}x\mathrm{d}y} Cov(X,Y)=∫−∞+∞∫−∞+∞(x−E(X))(y−E(Y))f(x,y)dxdy
- 设 X 1 , X 2 , … , X n X_1,X_2,\dots,X_n X1,X2,…,Xn 为方差存在的随机变量,则 V a r ( ∑ i = 1 n X i ) = ∑ i = 1 n V a r ( X i ) + 2 ∑ 1 ≤ i < j ≤ n C o v ( X i , X j ) \mathrm{Var}\left(\displaystyle\sum_{i=1}^n{X_i}\right)=\displaystyle\sum_{i=1}^n{\mathrm{Var}(X_i)}+2\displaystyle\sum_{1 \leq i<j \leq n}{\mathrm{Cov}(X_i, X_j)} Var(i=1∑nXi)=i=1∑nVar(Xi)+21≤i<j≤n∑Cov(Xi,Xj)
- 协方差的性质:
- C o v ( X , Y ) = C o v ( Y , X ) \mathrm{Cov}(X, Y)=\mathrm{Cov}(Y, X) Cov(X,Y)=Cov(Y,X)
- C o v ( X , X ) = V a r ( X ) \mathrm{Cov}(X, X)=\mathrm{Var}(X) Cov(X,X)=Var(X)
- C o v ( a X , b Y ) = a b C o v ( X , Y ) \mathrm{Cov}(aX, bY)=ab\mathrm{Cov}(X, Y) Cov(aX,bY)=abCov(X,Y)
- 若 C o v ( X i , Y ) \mathrm{Cov}(X_i, Y) Cov(Xi,Y) 存在,则 C o v ( X 1 + X 2 , Y ) = C o v ( X 1 , Y ) + C o v ( X 2 , Y ) \mathrm{Cov}(X_1+X_2, Y)=\mathrm{Cov}(X_1, Y)+\mathrm{Cov}(X_2, Y) Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y)
- 若 X , Y X,Y X,Y 相互独立,则 C o v ( X , Y ) = 0 \mathrm{Cov}(X,Y)=0 Cov(X,Y)=0,但反之不然
- 当 V a r ( X ) ⋅ V a r ( Y ) ≠ 0 \mathrm{Var}(X) \cdot \mathrm{Var}(Y) \ne 0 Var(X)⋅Var(Y)=0 时,有 V a r 2 ( X , Y ) ≤ V a r ( X ) ⋅ V a r ( Y ) \mathrm{Var}^2(X,Y) \leq \mathrm{Var}(X) \cdot \mathrm{Var}(Y) Var2(X,Y)≤Var(X)⋅Var(Y),等号成立当且仅当 X , Y X,Y X,Y 之间有严格的线性关系,即存在常数 c 1 , c 2 c_1,c_2 c1,c2 使得 P { Y = c 1 + c 2 X } = 1 P\{Y=c_1+c_2X\}=1 P{Y=c1+c2X}=1
相关系数
- 对于随机变量
X
,
Y
X,Y
X,Y,当
E
(
X
2
)
,
E
(
Y
2
)
E(X^2),E(Y^2)
E(X2),E(Y2) 均存在,且
V
a
r
(
X
)
,
V
a
r
(
Y
)
≠
0
\mathrm{Var}(X),\mathrm{Var}(Y) \ne 0
Var(X),Var(Y)=0 时,称
ρ
X
Y
=
C
o
v
(
X
,
Y
)
V
a
r
(
X
)
V
a
r
(
Y
)
\rho_{XY}=\dfrac{\mathrm{Cov}(X,Y)}{\sqrt{\mathrm{Var}(X)}\sqrt{\mathrm{Var}(Y)}}
ρXY=Var(X)Var(Y)Cov(X,Y)
- 标准化定义: ρ X Y = C o v ( X ∗ , Y ∗ ) \rho_{XY}=\mathrm{Cov}(X^*,Y^*) ρXY=Cov(X∗,Y∗),其中 X ∗ = X − E ( X ) D ( X ) , Y ∗ = Y − E ( Y ) D ( Y ) X^*=\dfrac{X-E(X)}{\sqrt{D(X)}},Y^*=\dfrac{Y-E(Y)}{\sqrt{D(Y)}} X∗=D(X)X−E(X),Y∗=D(Y)Y−E(Y)
- 相关系数的性质:
- 若 X , Y X,Y X,Y 相互独立,则 ρ X Y = 0 \rho_{XY}=0 ρXY=0,但反之不然
- ∣ ρ X Y ∣ ≤ 1 |\rho_{XY}| \leq 1 ∣ρXY∣≤1,等号成立当且仅当 X , Y X,Y X,Y 之间有严格的线性关系,即存在常数 c 1 , c 2 c_1,c_2 c1,c2 使得 P { Y = c 1 + c 2 X } = 1 P\{Y=c_1+c_2X\}=1 P{Y=c1+c2X}=1
- 当随机变量
X
,
Y
X,Y
X,Y 的相关系数
ρ
X
Y
=
0
\rho_{XY}=0
ρXY=0 时,称
X
,
Y
X,Y
X,Y 不相关,等价定义:
- C o v ( X , Y ) = 0 \mathrm{Cov}(X,Y)=0 Cov(X,Y)=0
- E ( X Y ) = E ( X ) E ( Y ) E(XY)=E(X)E(Y) E(XY)=E(X)E(Y)
- D ( X + Y ) = D ( X ) + D ( Y ) D(X+Y)=D(X)+D(Y) D(X+Y)=D(X)+D(Y)
上 α \alpha α 分位数
- 设连续型随机变量的分布函数 F ( x ) F(x) F(x) 和密度函数 f ( x ) f(x) f(x),对任意 0 < α < 1 0<\alpha<1 0<α<1,称满足条件 1 − F ( x α ) = ∫ x α + ∞ f ( x ) d x = α 1-F(x_\alpha)=\displaystyle\int_{x_\alpha}^{+\infty}{f(x)\mathrm{d}x}=\alpha 1−F(xα)=∫xα+∞f(x)dx=α 的实数 x α x_\alpha xα 为随机变量 X X X 的上 α \alpha α 分位数
- 由正态分布对称性, z 1 − α = − z α z_{1-\alpha}=-z_\alpha z1−α=−zα
协方差矩阵
-
记 n n n 元随机变量 X = ( X 1 , X 2 , ⋯ , X n ) T \bm{X}=(X_1,X_2,\cdots,X_n)^T X=(X1,X2,⋯,Xn)T,若其每一分量的方差都存在,则称 C o v ( X ) = E [ ( X − E ( X ) ) ( X − E ( X ) ) T ] = [ C o v ( X i , X j ) ] n × n \mathrm{Cov}(\bm{X})=E[(\bm{X}-E(\bm{X}))(\bm{X}-E(\bm{X}))^T]=[\mathrm{Cov}(X_i,X_j)]_{n \times n} Cov(X)=E[(X−E(X))(X−E(X))T]=[Cov(Xi,Xj)]n×n 为 n n n 元随机变量 X \bm{X} X 的协方差矩阵
-
n n n 元随机变量 X = ( X 1 , X 2 , ⋯ , X n ) T \bm{X}=(X_1,X_2,\cdots,X_n)^T X=(X1,X2,⋯,Xn)T,它的每一分量的方差都存在,记 X \bm{X} X 的协方差矩阵为 B = C o v ( X ) \bm{B}=\mathrm{Cov}(\bm{X}) B=Cov(X),数学期望为 a = E ( X ) = ( E ( X 1 ) , E ( X 2 ) , … , E ( X n ) ) T \bm{a}=E(\bm{X})=(E(X_1),E(X_2),\dots,E(X_n))^T a=E(X)=(E(X1),E(X2),…,E(Xn))T,则由密度函数 f ( x ) = 1 ( 2 π ) n ∣ B ∣ exp [ − 1 2 ( x − a ) T B − 1 ( x − a ) ] f(\bm{x})=\dfrac{1}{\sqrt{(2\pi)^n|\bm{B}|}}\exp\left[-\dfrac12(\bm{x}-\bm{a})^T\bm{B}^{-1}(\bm{x}-\bm{a})\right] f(x)=(2π)n∣B∣1exp[−21(x−a)TB−1(x−a)] 定义的分布为 n n n 元正态分布,常记为 X ∼ N ( a , B ) \bm{X} \sim N(\bm{a},\bm{B}) X∼N(a,B),其中 x = ( x 1 , x 2 , … , x n ) T \bm{x}=(x_1,x_2,\dots,x_n)^T x=(x1,x2,…,xn)T, ∣ B ∣ = det B |\bm{B}|=\det\bm{B} ∣B∣=detB
- 二元正态分布的协方差矩阵: B = ( σ 1 2 σ 1 σ 2 ρ σ 2 σ 1 ρ σ 2 2 ) \bm{B}=\begin{pmatrix}\sigma_1^2 & \sigma_1\sigma_2\rho \\ \sigma_2\sigma_1\rho & \sigma_2^2\end{pmatrix} B=(σ12σ2σ1ρσ1σ2ρσ22)
- n n n 元正态变量 ( X 1 , X 2 , ⋯ , X n ) T (X_1,X_2,\cdots,X_n)^T (X1,X2,⋯,Xn)T 中的任意 k k k 元子向量 ( X i 1 , X i 2 , … , X i k ) T (X_{i_1},X_{i_2},\dots,X_{i_k})^T (Xi1,Xi2,…,Xik)T 也服从 k k k 元正态分布;特别地, n n n 元正态变量的每一个分量都服从一元正态分布;反之,若 X i X_i Xi 都是相互独立的正态变量,则 ( X 1 , X 2 , ⋯ , X n ) T (X_1,X_2,\cdots,X_n)^T (X1,X2,⋯,Xn)T 服从 n n n 元正态分布
- X = ( X 1 , X 2 , ⋯ , X n ) T \bm{X}=(X_1,X_2,\cdots,X_n)^T X=(X1,X2,⋯,Xn)T 服从 n n n 元正态分布的充要条件是任意关于分量的线性组合均服从一元正态分布,即对任意 n n n 元实向量 l = ( l 1 , l 2 , … , l n ) T \bm{l}=(l_1,l_2,\dots,l_n)^T l=(l1,l2,…,ln)T,其中 ∣ l ∣ ≠ 0 |\bm{l}| \ne 0 ∣l∣=0,有 X ∼ N ( a , B ) ⟺ l T B = ∑ i = 1 n l i X i ∼ N ( l T a , l T B l ) \bm{X} \sim N(\bm{a},\bm{B}) \iff \bm{l}^T\bm{B}=\displaystyle\sum_{i=1}^n{l_iX_i} \sim N(\bm{l}^T\bm{a},\bm{l}^T\bm{B}\bm{l}) X∼N(a,B)⟺lTB=i=1∑nliXi∼N(lTa,lTBl)
- 正态变量线性变换不变性:对于 n n n 元正态变量 X = ( X 1 , X 2 , ⋯ , X n ) T \bm{X}=(X_1,X_2,\cdots,X_n)^T X=(X1,X2,⋯,Xn)T,若 Y 1 , Y 2 , … , Y k Y_1,Y_2,\dots,Y_k Y1,Y2,…,Yk 都是 X 1 , X 2 , … , X n X_1,X_2,\dots,X_n X1,X2,…,Xn 的线性函数,则 Y = ( Y 1 , Y 2 , … , Y k ) T \bm{Y}=(Y_1,Y_2,\dots,Y_k)^T Y=(Y1,Y2,…,Yk)T 服从 k k k 元正态分布,用矩阵形式表述,若 X ∼ N ( a , B ) , C = [ c i j ] k × n \bm{X} \sim N(\bm{a},\bm{B}),\bm{C}=[c_{ij}]_{k \times n} X∼N(a,B),C=[cij]k×n,则 Y = C X ∼ N ( C a , C B C T ) \bm{Y}=\bm{C}\bm{X} \sim N(\bm{C}\bm{a},\bm{C}\bm{B}\bm{C}^T) Y=CX∼N(Ca,CBCT)
大数定律及中心极限定理
依概率收敛
- 设
{
Y
n
,
n
≥
1
}
\{Y_n, n\ge 1\}
{Yn,n≥1} 为一随机变量序列,
c
c
c 为一常数,若对任意的
ε
>
0
\varepsilon>0
ε>0,都有
lim
n
→
+
∞
P
{
∣
Y
n
−
c
∣
≥
ε
}
=
0
\displaystyle\lim_{n \to +\infty}{P\{|Y_n-c| \ge \varepsilon\}}=0
n→+∞limP{∣Yn−c∣≥ε}=0 成立,则称
{
Y
n
,
n
≥
1
}
\{Y_n, n\ge 1\}
{Yn,n≥1} 依概率收敛于
c
c
c,记为
Y
n
→
P
c
,
n
→
+
∞
Y_n \xrightarrow{P} c, n \to +\infty
YnPc,n→+∞
- 等价表示: lim n → + ∞ P { ∣ Y n − c ∣ < ε } = 1 \displaystyle\lim_{n \to +\infty}{P\{|Y_n-c|<\varepsilon\}}=1 n→+∞limP{∣Yn−c∣<ε}=1
- 设 X n → P a , Y n → P b , n → + ∞ X_n \xrightarrow{P} a, Y_n \xrightarrow{P} b, n \to +\infty XnPa,YnPb,n→+∞,其中 a , b a,b a,b 为常数,若二元函数 g ( x , y ) g(x,y) g(x,y) 在点 ( a , b ) (a,b) (a,b) 处连续,则有 g ( X n , Y n ) → P g ( a , b ) , n → + ∞ g(X_n,Y_n) \xrightarrow{P} g(a,b), n \to +\infty g(Xn,Yn)Pg(a,b),n→+∞
马尔可夫(Markov)不等式
- 若随机变量
Y
Y
Y 的
k
k
k 阶(原点)矩存在,则对任意的
ε
>
0
\varepsilon>0
ε>0,有
P
{
∣
Y
∣
≥
ε
}
≤
E
(
∣
Y
∣
k
)
ε
k
P\{|Y| \ge \varepsilon\} \leq \dfrac{E(|Y|^k)}{\varepsilon^k}
P{∣Y∣≥ε}≤εkE(∣Y∣k)
- 证明:构造 Z = { ε , ∣ Y ∣ ≥ ε 0 , ∣ Y ∣ < ε Z=\begin{cases}\varepsilon, & |Y| \ge \varepsilon \\ 0, & |Y|<\varepsilon\end{cases} Z={ε,0,∣Y∣≥ε∣Y∣<ε,则 Z k ≤ ∣ Y ∣ k Z^k \leq |Y|^k Zk≤∣Y∣k,故 E ( Z k ) ≤ E ( ∣ Y ∣ k ) E(Z^k) \leq E(|Y|^k) E(Zk)≤E(∣Y∣k),注意到 E ( Z k ) = ε k ⋅ P { ∣ Y ∣ ≥ ε } E(Z^k)=\varepsilon^k \cdot P\{|Y| \ge \varepsilon\} E(Zk)=εk⋅P{∣Y∣≥ε},因此 P { ∣ Y ∣ ≥ ε } = E ( Z k ) ε k ≤ E ( ∣ Y ∣ k ) ε k P\{|Y| \ge \varepsilon\}=\dfrac{E(Z^k)}{\varepsilon^k} \leq \dfrac{E(|Y|^k)}{\varepsilon^k} P{∣Y∣≥ε}=εkE(Zk)≤εkE(∣Y∣k)
切比雪夫(Chebyshev)不等式
- 设随机变量
X
X
X 存在期望
μ
\mu
μ 和方差
σ
2
\sigma^2
σ2,则对任意的
ε
>
0
\varepsilon>0
ε>0,有
P
{
∣
X
−
μ
∣
≥
ε
}
≤
σ
2
ε
2
P\{|X-\mu| \ge \varepsilon\} \leq \dfrac{\sigma^2}{\varepsilon^2}
P{∣X−μ∣≥ε}≤ε2σ2
- 证明:取 Y = X − μ , k = 2 Y=X-\mu,k=2 Y=X−μ,k=2,利用马尔可夫不等式即可
弱大数定律
- 设随机变量序列
{
Y
i
,
i
≥
1
}
\{Y_i, i \ge 1\}
{Yi,i≥1},若存在常数序列
{
c
n
,
n
≥
1
}
\{c_n, n \ge 1\}
{cn,n≥1},使得对任意的
ε
>
0
\varepsilon>0
ε>0,有
lim
n
→
+
∞
P
{
∣
1
n
∑
i
=
1
n
Y
i
−
c
n
∣
≥
ε
}
=
0
\displaystyle\lim_{n \to +\infty}{P\left\{\left|\dfrac1n\displaystyle\sum_{i=1}^n{Y_i}-c_n\right| \ge \varepsilon\right\}}=0
n→+∞limP{∣∣∣∣∣n1i=1∑nYi−cn∣∣∣∣∣≥ε}=0,则称
{
Y
i
,
i
≥
1
}
\{Y_i, i \ge 1\}
{Yi,i≥1} 服从弱大数定律,记作
1
n
∑
i
=
1
n
Y
i
−
c
n
→
P
0
,
n
→
+
∞
\dfrac1n\displaystyle\sum_{i=1}^n{Y_i}-c_n \xrightarrow{P} 0, n \to +\infty
n1i=1∑nYi−cnP0,n→+∞
- 特别地,当 c n ≡ c c_n \equiv c cn≡c 时,可记为 1 n ∑ i = 1 n Y i → P c , n → + ∞ \dfrac1n\displaystyle\sum_{i=1}^n{Y_i} \xrightarrow{P} c, n \to +\infty n1i=1∑nYiPc,n→+∞
伯努利(Bernoulli)大数定律
- 设 n A n_A nA 为 n n n 重伯努利试验中事件 A A A 发生的次数, p p p 为事件 A A A 发生的概率,则对任意的 ε > 0 \varepsilon>0 ε>0,有 lim n → + ∞ P { ∣ n A n − p ∣ ≥ ε } = 0 \displaystyle\lim_{n \to +\infty}{P\left\{\left|\dfrac{n_A}{n}-p\right| \ge \varepsilon\right\}}=0 n→+∞limP{∣∣∣nnA−p∣∣∣≥ε}=0
辛钦(Khinchin)大数定律
- 设 { X i , i ≥ 1 } \{X_i, i \ge 1\} {Xi,i≥1} 为独立同分布的随机变量序列,且存在期望 μ \mu μ,则对任意的 ε > 0 \varepsilon>0 ε>0,有 lim n → + ∞ P { ∣ 1 n ∑ i = 1 n X i − μ ∣ ≥ ε } = 0 \displaystyle\lim_{n \to +\infty}{P\left\{\left|\dfrac1n\displaystyle\sum_{i=1}^n{X_i}-\mu\right| \ge \varepsilon\right\}}=0 n→+∞limP{∣∣∣∣∣n1i=1∑nXi−μ∣∣∣∣∣≥ε}=0
林德伯格(Lindeberg)-莱维(Lévy)中心极限定理
- 设
{
X
i
,
i
≥
1
}
\{X_i, i \ge 1\}
{Xi,i≥1} 为独立同分布的随机变量序列,且存在期望
E
(
X
i
)
=
μ
E(X_i)=\mu
E(Xi)=μ 和方差
D
(
X
i
)
=
σ
2
D(X_i)=\sigma^2
D(Xi)=σ2,则对任意的
x
∈
R
x \in \mathbb{R}
x∈R,
lim
n
→
+
∞
P
{
∑
i
=
1
n
X
i
−
E
(
∑
i
=
1
n
X
i
)
D
(
∑
i
=
1
n
X
i
)
≤
x
}
=
lim
n
→
+
∞
P
{
∑
i
=
1
n
X
i
−
n
μ
σ
n
≤
x
}
=
Φ
(
x
)
\displaystyle\lim_{n \to +\infty}{P\left\{\dfrac{\displaystyle\sum_{i=1}^n{X_i}-E\left(\displaystyle\sum_{i=1}^n{X_i}\right)}{\sqrt{D\left(\displaystyle\sum_{i=1}^n{X_i}\right)}} \leq x\right\}}=\displaystyle\lim_{n \to +\infty}{P\left\{\dfrac{\displaystyle\sum_{i=1}^n{X_i}-n\mu}{\sigma\sqrt{n}} \leq x\right\}}=\Phi(x)
n→+∞limP⎩⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎧D(i=1∑nXi)i=1∑nXi−E(i=1∑nXi)≤x⎭⎪⎪⎪⎪⎪⎬⎪⎪⎪⎪⎪⎫=n→+∞limP⎩⎪⎪⎪⎪⎨⎪⎪⎪⎪⎧σni=1∑nXi−nμ≤x⎭⎪⎪⎪⎪⎬⎪⎪⎪⎪⎫=Φ(x)
- 推论:当 n n n 充分大时, ∑ i = 1 n X i − n μ σ n = 1 n ∑ i = 1 n X i − μ σ / n = X ‾ − μ σ / n ∼ N ( 0 , 1 ) \dfrac{\displaystyle\sum_{i=1}^n{X_i}-n\mu}{\sigma\sqrt{n}}=\dfrac{\dfrac1n\displaystyle\sum_{i=1}^n{X_i}-\mu}{\sigma/\sqrt{n}}=\dfrac{\overline{X}-\mu}{\sigma/\sqrt{n}} \sim N(0,1) σni=1∑nXi−nμ=σ/nn1i=1∑nXi−μ=σ/nX−μ∼N(0,1)
棣莫弗(De Moivre)-拉普拉斯(Laplace)中心极限定理
- 设 n A n_A nA 为 n n n 重伯努利试验中事件 A A A 发生的次数, p p p 为事件 A A A 发生的概率,则对任意的 x ∈ R x \in \mathbb{R} x∈R,有 lim n → + ∞ P { n A − n p n p ( 1 − p ) ≤ x } = Φ ( x ) \displaystyle\lim_{n \to +\infty}{P\left\{\dfrac{n_A-np}{\sqrt{np(1-p)}} \leq x\right\}}=\Phi(x) n→+∞limP{np(1−p)nA−np≤x}=Φ(x)
统计量与抽样分布
统计量
- 样本均值 X ‾ = 1 n ∑ i = 1 n X i \overline{X}=\dfrac1n\displaystyle\sum_{i=1}^n{X_i} X=n1i=1∑nXi
- 样本方差 S 2 = 1 n − 1 ∑ i = 1 n ( X i − X ‾ ) 2 = 1 n − 1 ( ∑ i = 1 n X i 2 − n X ‾ 2 ) S^2=\dfrac1{n-1}\displaystyle\sum_{i=1}^n{(X_i-\overline{X})^2}=\dfrac1{n-1}\left(\displaystyle\sum_{i=1}^n{X_i^2}-n\overline{X}^2\right) S2=n−11i=1∑n(Xi−X)2=n−11(i=1∑nXi2−nX2)
- 样本标准差 S = S 2 = 1 n − 1 ∑ i = 1 n ( X i − X ‾ ) 2 S=\sqrt{S^2}=\sqrt{\dfrac1{n-1}\displaystyle\sum_{i=1}^n{(X_i-\overline{X})^2}} S=S2=n−11i=1∑n(Xi−X)2
- 样本 k k k 阶(原点)矩 A k = 1 n ∑ i = 1 n X i k , k ∈ N + A_k=\dfrac1n\displaystyle\sum_{i=1}^n{X_i^k}, k \in \mathbb{N}^+ Ak=n1i=1∑nXik,k∈N+
- 样本 k k k 阶中心矩 B k = 1 n ∑ i = 1 n ( X i − X ‾ ) k , k ∈ N + B_k=\dfrac1n\displaystyle\sum_{i=1}^n{(X_i-\overline{X})^k}, k \in \mathbb{N}^+ Bk=n1i=1∑n(Xi−X)k,k∈N+
χ 2 \chi^2 χ2 分布
- 设
X
1
,
X
2
,
…
,
X
n
X_1,X_2,\dots,X_n
X1,X2,…,Xn 为独立同分布的随机变量,且都服从
N
(
0
,
1
)
N(0,1)
N(0,1),令
Y
=
X
1
2
+
X
2
2
+
⋯
+
X
n
2
Y=X_1^2+X_2^2+\cdots+X_n^2
Y=X12+X22+⋯+Xn2,则称
Y
Y
Y 服从自由度为
n
n
n 的
χ
2
\chi^2
χ2 分布,记作
Y
∼
χ
2
(
n
)
Y \sim \chi^2(n)
Y∼χ2(n)
- E ( χ 2 ( n ) ) = ∑ i = 1 n E ( X i 2 ) = ∑ i = 1 n [ E ( X i ) + D ( X i ) ] = n E(\chi^2(n))=\displaystyle\sum_{i=1}^n{E(X_i^2)}=\displaystyle\sum_{i=1}^n{[E(X_i)+D(X_i)]}=n E(χ2(n))=i=1∑nE(Xi2)=i=1∑n[E(Xi)+D(Xi)]=n
- D ( χ 2 ( n ) ) = ∑ i = 1 n D ( X i 2 ) = ∑ i = 1 n [ E ( X i 4 ) − ( E ( X i 2 ) ) 2 ] = ∵ E ( Z 4 ) = 3 2 n D(\chi^2(n))=\displaystyle\sum_{i=1}^n{D(X_i^2)}=\displaystyle\sum_{i=1}^n{[E(X_i^4)-(E(X_i^2))^2]} \xlongequal{\because E(Z^4)=3} 2n D(χ2(n))=i=1∑nD(Xi2)=i=1∑n[E(Xi4)−(E(Xi2))2]∵E(Z4)=32n
t t t 分布
- 设
X
∼
N
(
0
,
1
)
,
Y
∼
χ
2
(
n
)
X \sim N(0,1), Y \sim \chi^2(n)
X∼N(0,1),Y∼χ2(n),且
X
,
Y
X,Y
X,Y 相互独立,则称随机变量
t
=
X
Y
/
n
t=\dfrac{X}{\sqrt{Y/n}}
t=Y/nX 服从自由度为
n
n
n 的
t
t
t 分布,记作
t
∼
t
(
n
)
t \sim t(n)
t∼t(n)
- t 1 − α ( n ) = − t α ( n ) t_{1-\alpha}(n)=-t_\alpha(n) t1−α(n)=−tα(n)
F F F 分布
- 设
U
∼
χ
2
(
n
1
)
,
V
∼
χ
2
(
n
2
)
U \sim \chi^2(n_1), V \sim \chi^2(n_2)
U∼χ2(n1),V∼χ2(n2),且
U
,
V
U,V
U,V 相互独立,则称随机变量
F
=
U
/
n
1
V
/
n
2
F=\dfrac{U/n_1}{V/n_2}
F=V/n2U/n1 服从自由度为
(
n
1
,
n
2
)
(n_1,n_2)
(n1,n2) 的
F
F
F 分布,记作
F
∼
F
(
n
1
,
n
2
)
F \sim F(n_1,n_2)
F∼F(n1,n2)
- 若 F ∼ F ( n 1 , n 2 ) F \sim F(n_1,n_2) F∼F(n1,n2),则 1 F ∼ F ( n 2 , n 1 ) \dfrac1F \sim F(n_2,n_1) F1∼F(n2,n1)
- 若 X ∼ t ( n ) X \sim t(n) X∼t(n),则 X 2 ∼ F ( 1 , n ) X^2 \sim F(1,n) X2∼F(1,n)
- F 1 − α ( n 1 , n 2 ) = 1 F α ( n 2 , n 1 ) F_{1-\alpha}(n_1,n_2)=\dfrac{1}{F_\alpha(n_2,n_1)} F1−α(n1,n2)=Fα(n2,n1)1
正态总体下的抽样分布
- 设
X
1
,
X
2
,
…
,
X
n
X_1,X_2,\dots,X_n
X1,X2,…,Xn 为来自正态总体
N
(
μ
,
σ
2
)
N(\mu,\sigma^2)
N(μ,σ2) 的简单随机样本,样本均值
X
‾
\overline{X}
X,样本方差
S
2
S^2
S2,则有
- X ‾ ∼ N ( μ , σ 2 n ) \overline{X} \sim N\left(\mu, \dfrac{\sigma^2}{n}\right) X∼N(μ,nσ2)
- ( n − 1 ) S 2 σ 2 ∼ χ 2 ( n − 1 ) \dfrac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1) σ2(n−1)S2∼χ2(n−1)
- X ‾ \overline{X} X 与 S 2 S^2 S2 相互独立
- X ‾ − μ S / n = X ‾ − μ σ 2 / n / ( n − 1 ) S 2 σ 2 ( n − 1 ) ∼ t ( n − 1 ) \dfrac{\overline{X}-\mu}{S/\sqrt{n}}=\left.\dfrac{\overline{X}-\mu}{\sqrt{\sigma^2/n}} \middle/ \sqrt{\dfrac{(n-1)S^2}{\sigma^2(n-1)}} \right.\sim t(n-1) S/nX−μ=σ2/nX−μ/σ2(n−1)(n−1)S2∼t(n−1)
- 设
X
1
,
X
2
,
…
,
X
n
1
X_1,X_2,\dots,X_{n_1}
X1,X2,…,Xn1 和
Y
1
,
Y
2
,
…
,
Y
n
2
Y_1,Y_2,\dots,Y_{n_2}
Y1,Y2,…,Yn2 分别为来自正态总体
N
(
μ
1
,
σ
1
2
)
N(\mu_1,\sigma_1^2)
N(μ1,σ12) 和
N
(
μ
2
,
σ
2
2
)
N(\mu_2,\sigma_2^2)
N(μ2,σ22) 的简单随机样本,样本均值
X
‾
\overline{X}
X 和
Y
‾
\overline{Y}
Y,样本方差
S
1
2
S_1^2
S12 和
S
2
2
S_2^2
S22,则有
- S 1 2 / σ 1 2 S 2 2 / σ 2 2 = ( n 1 − 1 ) S 1 2 σ 1 2 / ( n 1 − 1 ) ( n 2 − 1 ) S 2 2 σ 2 2 / ( n 2 − 1 ) ∼ F ( n 1 − 1 , n 2 − 1 ) \dfrac{S_1^2/\sigma_1^2}{S_2^2/\sigma_2^2}=\dfrac{\left.\dfrac{(n_1-1)S_1^2}{\sigma_1^2} \middle/ (n_1-1)\right.}{\left.\dfrac{(n_2-1)S_2^2}{\sigma_2^2} \middle/ (n_2-1)\right.} \sim F(n_1-1,n_2-1) S22/σ22S12/σ12=σ22(n2−1)S22/(n2−1)σ12(n1−1)S12/(n1−1)∼F(n1−1,n2−1)
- 当 σ 1 2 = σ 2 2 = σ 2 \sigma_1^2=\sigma_2^2=\sigma^2 σ12=σ22=σ2 时, X ‾ − Y ‾ ∼ N ( μ 1 − μ 2 , σ 2 n 1 + σ 2 n 2 ) \overline{X}-\overline{Y} \sim N\left(\mu_1-\mu_2,\dfrac{\sigma^2}{n_1}+\dfrac{\sigma^2}{n_2}\right) X−Y∼N(μ1−μ2,n1σ2+n2σ2),令 U = ( X ‾ − Y ‾ ) − ( μ 1 − μ 2 ) σ 2 n 1 + σ 2 n 2 ∼ N ( 0 , 1 ) U=\dfrac{(\overline{X}-\overline{Y})-(\mu_1-\mu_2)}{\sqrt{\dfrac{\sigma^2}{n_1}+\dfrac{\sigma^2}{n_2}}} \sim N(0,1) U=n1σ2+n2σ2(X−Y)−(μ1−μ2)∼N(0,1) 和 V = ( n 1 − 1 ) S 1 2 σ 2 + ( n 2 − 1 ) S 2 2 σ 2 ∼ χ 2 ( n 1 + n 2 − 2 ) V=\dfrac{(n_1-1)S_1^2}{\sigma^2}+\dfrac{(n_2-1)S_2^2}{\sigma^2} \sim \chi^2(n_1+n_2-2) V=σ2(n1−1)S12+σ2(n2−1)S22∼χ2(n1+n2−2),记 S w 2 = ( n 1 − 1 ) S 1 2 + ( n 2 − 1 ) S 2 2 n 1 + n 2 − 2 S_w^2=\dfrac{(n_1-1)S_1^2+(n_2-1)S_2^2}{n_1+n_2-2} Sw2=n1+n2−2(n1−1)S12+(n2−1)S22,则 ( X ‾ − Y ‾ ) − ( μ 1 − μ 2 ) S w 1 n 1 + 1 n 2 = U V / ( n 1 + n 2 − 2 ) ∼ t ( n 1 + n 2 − 2 ) \dfrac{(\overline{X}-\overline{Y})-(\mu_1-\mu_2)}{S_w\sqrt{\dfrac{1}{n_1}+\dfrac{1}{n_2}}}=\dfrac{U}{\sqrt{V/(n_1+n_2-2)}} \sim t(n_1+n_2-2) Swn11+n21(X−Y)−(μ1−μ2)=V/(n1+n2−2)U∼t(n1+n2−2)
参数估计
矩估计
- 设
θ
1
,
θ
2
,
…
,
θ
m
\theta_1,\theta_2,\dots,\theta_m
θ1,θ2,…,θm 是总体
X
X
X 的带估计参数,并假定
X
X
X 的前
m
m
m 阶矩存在,矩估计的步骤如下:
- 求总体 X X X 的前 m m m 阶矩(不妨设是原点矩) μ 1 , μ 2 , … , μ m \mu_1,\mu_2,\dots,\mu_m μ1,μ2,…,μm,一般地,这些矩可以写成待估计参数 θ 1 , θ 2 , … , θ m \theta_1,\theta_2,\dots,\theta_m θ1,θ2,…,θm 的函数形式,记为 { μ 1 = E ( X ) = g 1 ( θ 1 , θ 2 , … , θ m ) μ 2 = E ( X 2 ) = g 2 ( θ 1 , θ 2 , … , θ m ) ⋯ ⋯ μ m = E ( X m ) = g m ( θ 1 , θ 2 , … , θ m ) \begin{cases}\mu_1=E(X)=g_1(\theta_1,\theta_2,\dots,\theta_m) \\ \mu_2=E(X^2)=g_2(\theta_1,\theta_2,\dots,\theta_m) \\ \cdots \cdots \\ \mu_m=E(X^m)=g_m(\theta_1,\theta_2,\dots,\theta_m)\end{cases} ⎩⎪⎪⎪⎨⎪⎪⎪⎧μ1=E(X)=g1(θ1,θ2,…,θm)μ2=E(X2)=g2(θ1,θ2,…,θm)⋯⋯μm=E(Xm)=gm(θ1,θ2,…,θm)
- 由上述方程组可以反解出 θ 1 , θ 2 , … , θ m \theta_1,\theta_2,\dots,\theta_m θ1,θ2,…,θm 关于前 m m m 阶矩的函数表达式,记为 { θ 1 = h 1 ( μ 1 , μ 2 , … , μ m ) θ 2 = h 2 ( μ 1 , μ 2 , … , μ m ) ⋯ ⋯ θ m = h m ( μ 1 , μ 2 , … , μ m ) \begin{cases}\theta_1=h_1(\mu_1,\mu_2,\dots,\mu_m) \\ \theta_2=h_2(\mu_1,\mu_2,\dots,\mu_m) \\ \cdots \cdots \\ \theta_m=h_m(\mu_1,\mu_2,\dots,\mu_m)\end{cases} ⎩⎪⎪⎪⎨⎪⎪⎪⎧θ1=h1(μ1,μ2,…,μm)θ2=h2(μ1,μ2,…,μm)⋯⋯θm=hm(μ1,μ2,…,μm)
- 以原点矩 A i A_i Ai 代替 μ i \mu_i μi,得到各个参数的点估计量 { θ ^ 1 = h 1 ( A 1 , A 2 , … , A m ) θ ^ 2 = h 2 ( A 1 , A 2 , … , A m ) ⋯ ⋯ θ ^ m = h m ( A 1 , A 2 , … , A m ) \begin{cases}\hat{\theta}_1=h_1(A_1,A_2,\dots,A_m) \\ \hat{\theta}_2=h_2(A_1,A_2,\dots,A_m) \\ \cdots \cdots \\ \hat{\theta}_m=h_m(A_1,A_2,\dots,A_m)\end{cases} ⎩⎪⎪⎪⎨⎪⎪⎪⎧θ^1=h1(A1,A2,…,Am)θ^2=h2(A1,A2,…,Am)⋯⋯θ^m=hm(A1,A2,…,Am)
- 矩估计中也可以用部分总体中心距 ν i \nu_i νi 代替原点矩 μ i \mu_i μi,用样本中心距 B i B_i Bi 代替原点矩 A i A_i Ai
极大似然估计
- 似然函数
L
(
θ
)
L(\theta)
L(θ):
- 设 X X X 为离散型总体,其概率分布律为 P { X = x } = p ( x ; θ ) P\{X=x\}=p(x;\theta) P{X=x}=p(x;θ), θ ∈ Θ \theta \in \Theta θ∈Θ 是未知的待估参数, Θ \Theta Θ 为参数空间, X 1 , X 2 , … , X n X_1,X_2,\dots,X_n X1,X2,…,Xn 是来自总体 X X X 的样本,设 x 1 , x 2 , … , x n x_1,x_2,\dots,x_n x1,x2,…,xn 是已经得到的样本值,则样本 X 1 , X 2 , … , X n X_1,X_2,\dots,X_n X1,X2,…,Xn 取到值 x 1 , x 2 , … , x n x_1,x_2,\dots,x_n x1,x2,…,xn 的概率为 P { X 1 = x 1 , X 2 = x 2 , … , X n = x n } = ∏ i = 1 n P { X i = x i } = ∏ i = 1 n p ( x i ; θ ) P\{X_1=x_1,X_2=x_2,\dots,X_n=x_n\}=\displaystyle\prod_{i=1}^n{P\{X_i=x_i\}}=\displaystyle\prod_{i=1}^n{p(x_i;\theta)} P{X1=x1,X2=x2,…,Xn=xn}=i=1∏nP{Xi=xi}=i=1∏np(xi;θ),记似然函数 L ( θ ) = L ( θ ; x 1 , x 2 , … , x n ) = ∏ i = 1 n p ( x i ; θ ) L(\theta)=L(\theta;x_1,x_2,\dots,x_n)=\displaystyle\prod_{i=1}^n{p(x_i;\theta)} L(θ)=L(θ;x1,x2,…,xn)=i=1∏np(xi;θ)
- 当 X X X 为连续型总体时,设有密度函数 f ( x ; θ ) f(x;\theta) f(x;θ), θ ∈ Θ \theta \in \Theta θ∈Θ 是未知的待估参数, Θ \Theta Θ 为参数空间, X 1 , X 2 , … , X n X_1,X_2,\dots,X_n X1,X2,…,Xn 是来自总体 X X X 的样本,设 x 1 , x 2 , … , x n x_1,x_2,\dots,x_n x1,x2,…,xn 是已经得到的样本值,此时似然函数 L ( θ ) = L ( θ ; x 1 , x 2 , … , x n ) = ∏ i = 1 n f ( x i ; θ ) L(\theta)=L(\theta;x_1,x_2,\dots,x_n)=\displaystyle\prod_{i=1}^n{f(x_i;\theta)} L(θ)=L(θ;x1,x2,…,xn)=i=1∏nf(xi;θ)
- 极大似然估计寻求参数
θ
\theta
θ 的估计值
θ
^
\hat\theta
θ^,使得
L
(
θ
)
L(\theta)
L(θ) 取到极大值,即
L
(
θ
^
)
=
max
θ
∈
Θ
L
(
θ
;
x
1
,
x
2
,
…
,
x
n
)
L(\hat\theta)=\displaystyle\max_{\theta \in \Theta}{L(\theta;x_1,x_2,\dots,x_n)}
L(θ^)=θ∈ΘmaxL(θ;x1,x2,…,xn),此时
- θ ^ = θ ^ ( x 1 , x 2 , … , x n ) \hat\theta=\hat\theta(x_1,x_2,\dots,x_n) θ^=θ^(x1,x2,…,xn) 称为极大似然估计值
- 相应的统计量 θ ^ ( X 1 , X 2 , … , X n ) \hat\theta(X_1,X_2,\dots,X_n) θ^(X1,X2,…,Xn) 称为极大似然估计量,简记为 M L E \mathrm{MLE} MLE
- 寻求极大似然估计常常采用微分方法:
- 求解似然方程 ∂ L ( θ ) ∂ θ ∣ θ = θ ^ = 0 \left.\dfrac{\partial L(\theta)}{\partial \theta}\right|_{\theta=\hat\theta}=0 ∂θ∂L(θ)∣∣∣∣θ=θ^=0
- 为了计算方便,往往事先进行取对数操作,记 l ( θ ) = ln L ( θ ) l(\theta)=\ln L(\theta) l(θ)=lnL(θ) 为对数似然函数
- 此时求解对数似然方程 ∂ l ( θ ) ∂ θ ∣ θ = θ ^ = ∂ ln L ( θ ) ∂ θ ∣ θ = θ ^ = 0 \left.\dfrac{\partial l(\theta)}{\partial \theta}\right|_{\theta=\hat\theta}=\left.\dfrac{\partial\ln L(\theta)}{\partial \theta}\right|_{\theta=\hat\theta}=0 ∂θ∂l(θ)∣∣∣∣θ=θ^=∂θ∂lnL(θ)∣∣∣∣θ=θ^=0
- 极大似然估计的不变性:设参数 θ \theta θ 的极大似然估计为 θ ^ \hat\theta θ^, θ ∗ = g ( θ ) \theta^*=g(\theta) θ∗=g(θ) 是 θ \theta θ 的连续函数,则参数 θ ∗ \theta^* θ∗ 的极大似然估计为 θ ^ ∗ = g ( θ ^ ) \hat\theta^*=g(\hat\theta) θ^∗=g(θ^)
无偏性准则
- 设
θ
∈
Θ
\theta \in \Theta
θ∈Θ 是总体
X
X
X 的待估参数,
X
1
,
X
2
,
…
,
X
n
X_1,X_2,\dots,X_n
X1,X2,…,Xn 是来自总体
X
X
X 的样本,若估计量
θ
^
(
X
1
,
X
2
,
…
,
X
n
)
\hat\theta(X_1,X_2,\dots,X_n)
θ^(X1,X2,…,Xn) 的期望存在,且满足
E
(
θ
^
)
=
θ
,
∀
θ
∈
Θ
E(\hat\theta)=\theta, \forall \theta \in \Theta
E(θ^)=θ,∀θ∈Θ,则称
θ
^
\hat\theta
θ^ 是
θ
\theta
θ 的无偏估计
- 若 E ( θ ^ ) ≠ θ E(\hat\theta) \ne \theta E(θ^)=θ,则称 E ( θ ^ ) − θ E(\hat\theta)-\theta E(θ^)−θ 为估计量 θ ^ \hat\theta θ^ 的偏差
- 若 E ( θ ^ ) ≠ θ E(\hat\theta) \ne \theta E(θ^)=θ,但 lim n → + ∞ E ( θ ^ ) = θ \displaystyle\lim_{n \to +\infty}{E(\hat\theta)}=\theta n→+∞limE(θ^)=θ,则称 θ ^ \hat\theta θ^ 是 θ \theta θ 的渐进无偏估计
有效性准则
- 设 θ ^ 1 = θ ^ 1 ( X 1 , X 2 , … , X n ) \hat\theta_1=\hat\theta_1(X_1,X_2,\dots,X_n) θ^1=θ^1(X1,X2,…,Xn) 与 θ ^ 2 = θ ^ 2 ( X 1 , X 2 , … , X n ) \hat\theta_2=\hat\theta_2(X_1,X_2,\dots,X_n) θ^2=θ^2(X1,X2,…,Xn) 都是参数 θ \theta θ 的无偏估计,若 ∀ θ ∈ Θ \forall \theta \in \Theta ∀θ∈Θ,有 V a r θ ( θ ^ 1 ) ≤ V a r θ ( θ ^ 2 ) \mathrm{Var}_\theta(\hat\theta_1) \leq \mathrm{Var}_\theta(\hat\theta_2) Varθ(θ^1)≤Varθ(θ^2),且至少有一个 θ \theta θ 使不等号成立,则称 θ ^ 1 \hat\theta_1 θ^1 比 θ ^ 2 \hat\theta_2 θ^2 有效
均方误差准则
- 设 θ ^ = θ ^ ( X 1 , X 2 , … , X n ) \hat\theta=\hat\theta(X_1,X_2,\dots,X_n) θ^=θ^(X1,X2,…,Xn) 是参数 θ \theta θ 的一般估计量,称 E [ ( θ ^ − θ ) 2 ] E[(\hat\theta-\theta)^2] E[(θ^−θ)2] 是估计量 θ ^ \hat\theta θ^ 的均方误差,记作 M s e ( θ ^ ) = V a r ( θ ^ ) + ( E ( θ ^ ) − θ ) 2 \mathrm{Mse}(\hat\theta)=\mathrm{Var}(\hat\theta)+(E(\hat\theta)-\theta)^2 Mse(θ^)=Var(θ^)+(E(θ^)−θ)2
- 设 θ ^ 1 \hat\theta_1 θ^1 与 θ ^ 2 \hat\theta_2 θ^2 都是参数 θ \theta θ 的估计量,若 ∀ θ ∈ Θ \forall \theta \in \Theta ∀θ∈Θ,有 M s e ( θ ^ 1 ) ≤ M s e ( θ ^ 2 ) \mathrm{Mse}(\hat\theta_1) \leq \mathrm{Mse}(\hat\theta_2) Mse(θ^1)≤Mse(θ^2),且至少有一个 θ \theta θ 使不等号成立,则称 θ ^ 1 \hat\theta_1 θ^1 优于 θ ^ 2 \hat\theta_2 θ^2
- 若 θ ^ \hat\theta θ^ 是参数 θ \theta θ 的无偏估计,即 E ( θ ^ ) = θ E(\hat\theta)=\theta E(θ^)=θ,则 M s e ( θ ^ ) = V a r ( θ ^ ) \mathrm{Mse}(\hat\theta)=\mathrm{Var}(\hat\theta) Mse(θ^)=Var(θ^)
- 当用于无偏估计之间的比较时,均方误差准则等价于有效性准则
相合性准则
- 设 θ ^ n = θ ^ ( X 1 , X 2 , … , X n ) \hat\theta_n=\hat\theta(X_1,X_2,\dots,X_n) θ^n=θ^(X1,X2,…,Xn) 是参数 θ \theta θ 的一般估计量,若对于任意 ε > 0 \varepsilon>0 ε>0,有 lim n → + ∞ P { ∣ θ ^ n − θ ∣ < ε } = 1 \displaystyle\lim_{n \to +\infty}{P\{|\hat\theta_n-\theta|<\varepsilon\}}=1 n→+∞limP{∣θ^n−θ∣<ε}=1,即 θ ^ n \hat\theta_n θ^n 依概率收敛于 θ \theta θ,则称 θ ^ n \hat\theta_n θ^n 是 θ \theta θ 的相合估计量,记作 θ ^ n → P θ \hat\theta_n \xrightarrow{P} \theta θ^nPθ
- 一般地,矩估计得到的参数估计都满足相合性,极大似然估计在总体分布满足一定条件下求得的参数估计才是相合估计量
单个正态总体的参数区间估计
- 均值
μ
\mu
μ 的置信区间(
σ
2
\sigma^2
σ2 已知):
- 常用 μ \mu μ 的点估计为样本均值 X ‾ \overline{X} X,有 X ‾ ∼ N ( μ , σ 2 n ) \overline{X} \sim N\left(\mu,\dfrac{\sigma^2}{n}\right) X∼N(μ,nσ2),即 X ‾ − μ σ / n ∼ N ( 0 , 1 ) \dfrac{\overline{X}-\mu}{\sigma/\sqrt{n}} \sim N(0,1) σ/nX−μ∼N(0,1)
- 取枢轴量 G ( X 1 , X 2 , … , X n ; μ ) = X ‾ − μ σ / n G(X_1,X_2,\dots,X_n;\mu)=\dfrac{\overline{X}-\mu}{\sigma/\sqrt{n}} G(X1,X2,…,Xn;μ)=σ/nX−μ
- 设常数 a < b a<b a<b,且满足 P { a < X ‾ − μ σ / n < b } = P { X ‾ − b σ n < μ < X ‾ − a σ n } = 1 − α P\left\{a<\dfrac{\overline{X}-\mu}{\sigma/\sqrt{n}}<b\right\}=P\left\{\overline{X}-b\dfrac{\sigma}{\sqrt{n}}<\mu<\overline{X}-a\dfrac{\sigma}{\sqrt{n}}\right\}=1-\alpha P{a<σ/nX−μ<b}=P{X−bnσ<μ<X−anσ}=1−α
- 区间平均长度 L = ( b − a ) σ n L=(b-a)\dfrac{\sigma}{\sqrt{n}} L=(b−a)nσ,根据正态分布对称性,令 a = − b = − z α / 2 a=-b=-z_{\alpha/2} a=−b=−zα/2 使区间平均长度最短
- 此时置信区间为 ( X ‾ − σ n z α / 2 , X ‾ + σ n z α / 2 ) \left(\overline{X}-\dfrac{\sigma}{\sqrt{n}}z_{\alpha/2}, \overline{X}+\dfrac{\sigma}{\sqrt{n}}z_{\alpha/2}\right) (X−nσzα/2,X+nσzα/2),简记为 ( X ‾ ± σ n z α / 2 ) \left(\overline{X} \pm \dfrac{\sigma}{\sqrt{n}}z_{\alpha/2}\right) (X±nσzα/2)
- 均值
μ
\mu
μ 的置信区间(
σ
2
\sigma^2
σ2 未知):
- 考虑 σ 2 \sigma^2 σ2 的无偏估计 S 2 S^2 S2,有 X ‾ − μ S / n ∼ t ( n − 1 ) \dfrac{\overline{X}-\mu}{S/\sqrt{n}} \sim t(n-1) S/nX−μ∼t(n−1)
- 取枢轴量 G ( X 1 , X 2 , … , X n ; μ ) = X ‾ − μ S / n G(X_1,X_2,\dots,X_n;\mu)=\dfrac{\overline{X}-\mu}{S/\sqrt{n}} G(X1,X2,…,Xn;μ)=S/nX−μ
- 有 P { ∣ X ‾ − μ S / n ∣ < t α / 2 ( n − 1 ) } = P { X ‾ − S n t α / 2 ( n − 1 ) < μ < X ‾ + S n t α / 2 ( n − 1 ) } = 1 − α P\left\{\left|\dfrac{\overline{X}-\mu}{S/\sqrt{n}}\right|<t_{\alpha/2}(n-1)\right\}=P\left\{\overline{X}-\dfrac{S}{\sqrt{n}}t_{\alpha/2}(n-1)<\mu<\overline{X}+\dfrac{S}{\sqrt{n}}t_{\alpha/2}(n-1)\right\}=1-\alpha P{∣∣∣∣S/nX−μ∣∣∣∣<tα/2(n−1)}=P{X−nStα/2(n−1)<μ<X+nStα/2(n−1)}=1−α
- 根据 t t t 分布对称性,置信区间取 ( X ‾ ± S n t α / 2 ( n − 1 ) ) \left(\overline{X} \pm \dfrac{S}{\sqrt{n}}t_{\alpha/2}(n-1)\right) (X±nStα/2(n−1))
- 成对数据情形(不相互独立),均值差
μ
1
−
μ
2
\mu_1-\mu_2
μ1−μ2 的置信区间:
- 令 D i = X i − Y i D_i=X_i-Y_i Di=Xi−Yi,则 D ‾ = X ‾ − Y ‾ , S D 2 = 1 n − 1 ∑ i = 1 n ( D i − D ‾ ) 2 \overline{D}=\overline{X}-\overline{Y}, S_D^2=\dfrac{1}{n-1}\displaystyle\sum_{i=1}^n{(D_i-\overline{D})^2} D=X−Y,SD2=n−11i=1∑n(Di−D)2
- μ D \mu_D μD 的置信区间取 ( D ‾ ± S D n t α / 2 ( n − 1 ) ) \left(\overline{D} \pm \dfrac{S_D}{\sqrt{n}}t_{\alpha/2}(n-1)\right) (D±nSDtα/2(n−1))
- 方差
σ
2
\sigma^2
σ2 的置信区间:
- 考虑 ( n − 1 ) S 2 σ 2 ∼ χ 2 ( n − 1 ) \dfrac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1) σ2(n−1)S2∼χ2(n−1)
- 取枢轴量 G ( X 1 , X 2 , … , X n ; σ 2 ) = ( n − 1 ) S 2 σ 2 G(X_1,X_2,\dots,X_n;\sigma^2)=\dfrac{(n-1)S^2}{\sigma^2} G(X1,X2,…,Xn;σ2)=σ2(n−1)S2
- 有 P { χ 1 − α / 2 2 ( n − 1 ) < ( n − 1 ) S 2 σ 2 < χ α / 2 2 ( n − 1 ) } = P { ( n − 1 ) S 2 χ α / 2 2 ( n − 1 ) < σ 2 < ( n − 1 ) S 2 χ 1 − α / 2 2 ( n − 1 ) } = 1 − α P\left\{\chi_{1-\alpha/2}^2(n-1)<\dfrac{(n-1)S^2}{\sigma^2}<\chi_{\alpha/2}^2(n-1)\right\}=P\left\{\dfrac{(n-1)S^2}{\chi_{\alpha/2}^2(n-1)}<\sigma^2<\dfrac{(n-1)S^2}{\chi_{1-\alpha/2}^2(n-1)}\right\}=1-\alpha P{χ1−α/22(n−1)<σ2(n−1)S2<χα/22(n−1)}=P{χα/22(n−1)(n−1)S2<σ2<χ1−α/22(n−1)(n−1)S2}=1−α
- σ 2 \sigma^2 σ2 的置信区间取 ( ( n − 1 ) S 2 χ α / 2 2 ( n − 1 ) , ( n − 1 ) S 2 χ 1 − α / 2 2 ( n − 1 ) ) \left(\dfrac{(n-1)S^2}{\chi_{\alpha/2}^2(n-1)}, \dfrac{(n-1)S^2}{\chi_{1-\alpha/2}^2(n-1)}\right) (χα/22(n−1)(n−1)S2,χ1−α/22(n−1)(n−1)S2)
- 由于 χ 2 \chi^2 χ2 分布的密度函数不对称,故上述置信区间不满足区间平均长度最短,但这样的解给实际应用带来方便
两个正态总体的参数区间估计
- 均值差
μ
1
−
μ
2
\mu_1-\mu_2
μ1−μ2 的置信区间(
σ
2
\sigma^2
σ2 和
σ
2
2
\sigma_2^2
σ22 已知):
- 利用 μ 1 − μ 2 \mu_1-\mu_2 μ1−μ2 的无偏估计 X ‾ − Y ‾ \overline{X}-\overline{Y} X−Y,有 X ‾ − Y ‾ ∼ N ( μ 1 − μ 2 , σ 1 2 n + σ 2 2 n ) \overline{X}-\overline{Y} \sim N\left(\mu_1-\mu_2, \dfrac{\sigma_1^2}{n}+\dfrac{\sigma_2^2}{n}\right) X−Y∼N(μ1−μ2,nσ12+nσ22)
- μ 1 − μ 2 \mu_1-\mu_2 μ1−μ2 的置信区间取 ( ( X ‾ − Y ‾ ) ± z α / 2 σ 1 2 n + σ 2 2 n ) \left((\overline{X}-\overline{Y}) \pm z_{\alpha/2}\sqrt{\dfrac{\sigma_1^2}{n}+\dfrac{\sigma_2^2}{n}}\right) ((X−Y)±zα/2nσ12+nσ22)
- 均值差
μ
1
−
μ
2
\mu_1-\mu_2
μ1−μ2 的置信区间(
σ
2
=
σ
2
2
=
σ
2
\sigma^2=\sigma_2^2=\sigma^2
σ2=σ22=σ2,但未知):
- 利用 S w 2 = ( n 1 − 1 ) S 1 2 + ( n 2 − 1 ) S 2 2 n 1 + n 2 − 2 S_w^2=\dfrac{(n_1-1)S_1^2+(n_2-1)S_2^2}{n_1+n_2-2} Sw2=n1+n2−2(n1−1)S12+(n2−1)S22,有 ( X ‾ − Y ‾ ) − ( μ 1 − μ 2 ) S w 1 n 1 + 1 n 2 ∼ t ( n 1 + n 2 − 2 ) \dfrac{(\overline{X}-\overline{Y})-(\mu_1-\mu_2)}{S_w\sqrt{\dfrac{1}{n_1}+\dfrac{1}{n_2}}} \sim t(n_1+n_2-2) Swn11+n21(X−Y)−(μ1−μ2)∼t(n1+n2−2)
- μ 1 − μ 2 \mu_1-\mu_2 μ1−μ2 的置信区间取 ( ( X ‾ − Y ‾ ) ± t α / 2 ( n 1 + n 2 − 2 ) S w 1 n 1 + 1 n 2 ) \left((\overline{X}-\overline{Y}) \pm t_{\alpha/2}(n_1+n_2-2)S_w\sqrt{\dfrac{1}{n_1}+\dfrac{1}{n_2}}\right) ((X−Y)±tα/2(n1+n2−2)Swn11+n21)
- 方差比
σ
1
2
σ
2
2
\dfrac{\sigma_1^2}{\sigma_2^2}
σ22σ12 的置信区间:
- 利用 σ 1 2 σ 2 2 \dfrac{\sigma_1^2}{\sigma_2^2} σ22σ12 的点估计 S 1 2 S 2 2 \dfrac{S_1^2}{S_2^2} S22S12,有 S 1 2 S 2 2 / σ 1 2 σ 2 2 = S 1 2 / σ 1 2 S 2 2 / σ 2 2 ∼ F ( n 1 − 1 , n 2 − 1 ) \left.\dfrac{S_1^2}{S_2^2} \middle/ \dfrac{\sigma_1^2}{\sigma_2^2}\right.=\dfrac{S_1^2/\sigma_1^2}{S_2^2/\sigma_2^2} \sim F(n_1-1,n_2-1) S22S12/σ22σ12=S22/σ22S12/σ12∼F(n1−1,n2−1)
- σ 1 2 σ 2 2 \dfrac{\sigma_1^2}{\sigma_2^2} σ22σ12 的置信区间取 ( S 1 2 / S 2 2 F α / 2 ( n 1 + n 2 − 2 ) , S 1 2 / S 2 2 F 1 − α / 2 ( n 1 + n 2 − 2 ) ) \left(\dfrac{S_1^2/S_2^2}{F_{\alpha/2}(n_1+n_2-2)}, \dfrac{S_1^2/S_2^2}{F_{1-\alpha/2}(n_1+n_2-2)}\right) (Fα/2(n1+n2−2)S12/S22,F1−α/2(n1+n2−2)S12/S22)
假设检验
单个正态总体参数的假设检验
- 均值
μ
\mu
μ 的假设检验(
σ
2
\sigma^2
σ2 已知),称为
Z
Z
Z 检验:
- 考虑双侧假设
H
0
:
μ
=
μ
0
,
H
1
:
μ
≠
μ
0
H_0:\mu=\mu_0,H_1:\mu \ne \mu_0
H0:μ=μ0,H1:μ=μ0,取检验统计量为
Z
=
X
‾
−
μ
0
σ
/
n
Z=\dfrac{\overline{X}-\mu_0}{\sigma/\sqrt{n}}
Z=σ/nX−μ0,拒绝域
W
=
{
∣
Z
∣
=
∣
X
‾
−
μ
0
σ
/
n
∣
≥
z
α
/
2
}
W=\left\{|Z|=\left|\dfrac{\overline{X}-\mu_0}{\sigma/\sqrt{n}}\right| \ge z_{\alpha/2}\right\}
W={∣Z∣=∣∣∣∣σ/nX−μ0∣∣∣∣≥zα/2}
- 对给定样本值 x 1 , x 2 , … , x n x_1,x_2,\dots,x_n x1,x2,…,xn,检验统计量 Z Z Z 的取值 z 0 = x ‾ − μ 0 σ / n z_0=\dfrac{\overline{x}-\mu_0}{\sigma/\sqrt{n}} z0=σ/nx−μ0,当 ∣ z 0 ∣ ≥ z α / 2 |z_0| \ge z_{\alpha/2} ∣z0∣≥zα/2 时,拒绝原假设
- P − = P H 0 { ∣ Z ∣ ≥ ∣ z 0 ∣ } = 2 P H 0 { Z ≥ ∣ z 0 ∣ } = 2 − 2 Φ ( ∣ z 0 ∣ ) P_-=P_{H_0}\{|Z| \ge |z_0|\}=2P_{H_0}\{Z \ge |z_0|\}=2-2\Phi(|z_0|) P−=PH0{∣Z∣≥∣z0∣}=2PH0{Z≥∣z0∣}=2−2Φ(∣z0∣),当 P − P_- P− 值小于等于显著水平 α \alpha α 时拒绝原假设
- 考虑左侧假设
H
0
:
μ
≥
μ
0
,
H
1
:
μ
<
μ
0
H_0:\mu \ge \mu_0,H_1:\mu<\mu_0
H0:μ≥μ0,H1:μ<μ0,取检验统计量为
Z
=
X
‾
−
μ
0
σ
/
n
Z=\dfrac{\overline{X}-\mu_0}{\sigma/\sqrt{n}}
Z=σ/nX−μ0,拒绝域
W
=
{
Z
=
X
‾
−
μ
0
σ
/
n
≤
c
}
W=\left\{Z=\dfrac{\overline{X}-\mu_0}{\sigma/\sqrt{n}} \leq c\right\}
W={Z=σ/nX−μ0≤c}
- 犯第 I 类错误的概率 α ( μ , c ) = P { X ‾ − μ 0 σ / n ≤ c | μ ≥ μ 0 } \alpha(\mu,c)=P\left\{\dfrac{\overline{X}-\mu_0}{\sigma/\sqrt{n}} \leq c \middle| \mu \ge \mu_0\right\} α(μ,c)=P{σ/nX−μ0≤c∣∣∣∣μ≥μ0},由于 Z Z Z 不服从标准正态分布,而是 Z ∼ N ( μ − μ 0 σ / n , 1 ) Z \sim N\left(\dfrac{\mu-\mu_0}{\sigma/\sqrt{n}}, 1\right) Z∼N(σ/nμ−μ0,1),因此 α ( μ , c ) = Φ ( c − μ − μ 0 σ / n 1 ) = Φ ( c − μ − μ 0 σ / n ) , μ ≥ μ 0 \alpha(\mu,c)=\Phi\left(\dfrac{c-\dfrac{\mu-\mu_0}{\sigma/\sqrt{n}}}{1}\right)=\Phi\left(c-\dfrac{\mu-\mu_0}{\sigma/\sqrt{n}}\right), \mu \ge \mu_0 α(μ,c)=Φ⎝⎜⎜⎛1c−σ/nμ−μ0⎠⎟⎟⎞=Φ(c−σ/nμ−μ0),μ≥μ0
- 当取 c = z 1 − α / 2 = − z α c=z_{1-\alpha/2}=-z_\alpha c=z1−α/2=−zα 时,犯第 II 类错误的概率最小,此时拒绝域 W = { Z = X ‾ − μ 0 σ / n ≤ − z α } W=\left\{Z=\dfrac{\overline{X}-\mu_0}{\sigma/\sqrt{n}} \leq -z_\alpha\right\} W={Z=σ/nX−μ0≤−zα}
- P − = sup μ ≥ μ 0 P { Z ≤ z 0 } = P { Z ≤ z 0 ∣ μ = μ 0 } = Φ ( z 0 ) P_-=\displaystyle\sup_{\mu \ge \mu_0}{P\{Z \leq z_0\}}=P\{Z \leq z_0 | \mu=\mu_0\}=\Phi(z_0) P−=μ≥μ0supP{Z≤z0}=P{Z≤z0∣μ=μ0}=Φ(z0),当 P − P_- P− 值小于等于显著水平 α \alpha α 时拒绝原假设
- 考虑右侧假设
H
0
:
μ
≤
μ
0
,
H
1
:
μ
>
μ
0
H_0:\mu \leq \mu_0,H_1:\mu>\mu_0
H0:μ≤μ0,H1:μ>μ0,取检验统计量为
Z
=
X
‾
−
μ
0
σ
/
n
Z=\dfrac{\overline{X}-\mu_0}{\sigma/\sqrt{n}}
Z=σ/nX−μ0,类似得到拒绝域
W
=
{
Z
=
X
‾
−
μ
0
σ
/
n
≥
z
α
}
W=\left\{Z=\dfrac{\overline{X}-\mu_0}{\sigma/\sqrt{n}} \ge z_\alpha\right\}
W={Z=σ/nX−μ0≥zα}
- P − = sup μ ≤ μ 0 P { Z ≥ z 0 } = P { Z ≥ z 0 ∣ μ = μ 0 } = 1 − Φ ( z 0 ) P_-=\displaystyle\sup_{\mu \leq \mu_0}{P\{Z \ge z_0\}}=P\{Z \ge z_0 | \mu=\mu_0\}=1-\Phi(z_0) P−=μ≤μ0supP{Z≥z0}=P{Z≥z0∣μ=μ0}=1−Φ(z0),当 P − P_- P− 值小于等于显著水平 α \alpha α 时拒绝原假设
- 考虑双侧假设
H
0
:
μ
=
μ
0
,
H
1
:
μ
≠
μ
0
H_0:\mu=\mu_0,H_1:\mu \ne \mu_0
H0:μ=μ0,H1:μ=μ0,取检验统计量为
Z
=
X
‾
−
μ
0
σ
/
n
Z=\dfrac{\overline{X}-\mu_0}{\sigma/\sqrt{n}}
Z=σ/nX−μ0,拒绝域
W
=
{
∣
Z
∣
=
∣
X
‾
−
μ
0
σ
/
n
∣
≥
z
α
/
2
}
W=\left\{|Z|=\left|\dfrac{\overline{X}-\mu_0}{\sigma/\sqrt{n}}\right| \ge z_{\alpha/2}\right\}
W={∣Z∣=∣∣∣∣σ/nX−μ0∣∣∣∣≥zα/2}
- 均值
μ
\mu
μ 的假设检验(
σ
2
\sigma^2
σ2 未知),称为
t
t
t 检验:
- 利用样本方差 S 2 S^2 S2 代替总体方差 σ 2 \sigma^2 σ2,取检验统计量 T = X ‾ − μ 0 S / n ∼ t ( n − 1 ) T=\dfrac{\overline{X}-\mu_0}{S/\sqrt{n}} \sim t(n-1) T=S/nX−μ0∼t(n−1),对给定样本值 x 1 , x 2 , … , x n x_1,x_2,\dots,x_n x1,x2,…,xn,检验统计量 T T T 的取值 t 0 = x ‾ − μ 0 σ / n t_0=\dfrac{\overline{x}-\mu_0}{\sigma/\sqrt{n}} t0=σ/nx−μ0
- 考虑双侧假设 H 0 : μ = μ 0 , H 1 : μ ≠ μ 0 H_0:\mu=\mu_0,H_1:\mu \ne \mu_0 H0:μ=μ0,H1:μ=μ0,拒绝域 W = { ∣ T ∣ = ∣ X ‾ − μ 0 S / n ∣ ≥ t α / 2 ( n − 1 ) } W=\left\{|T|=\left|\dfrac{\overline{X}-\mu_0}{S/\sqrt{n}}\right| \ge t_{\alpha/2}(n-1)\right\} W={∣T∣=∣∣∣∣S/nX−μ0∣∣∣∣≥tα/2(n−1)}, P − = 2 P H 0 { t ( n − 1 ) ≥ ∣ t 0 ∣ } P_-=2P_{H_0}\{t(n-1) \ge |t_0|\} P−=2PH0{t(n−1)≥∣t0∣}
- 考虑左侧假设 H 0 : μ ≥ μ 0 , H 1 : μ < μ 0 H_0:\mu \ge \mu_0,H_1:\mu<\mu_0 H0:μ≥μ0,H1:μ<μ0,拒绝域 W = { T = X ‾ − μ 0 S / n ≤ − t α ( n − 1 ) } W=\left\{T=\dfrac{\overline{X}-\mu_0}{S/\sqrt{n}} \leq -t_{\alpha}(n-1)\right\} W={T=S/nX−μ0≤−tα(n−1)}, P − = sup μ ≥ μ 0 P { T ≤ t 0 } = P { t ( n − 1 ) ≤ t 0 } P_-=\displaystyle\sup_{\mu \ge \mu_0}{P\{T \leq t_0\}}=P\{t(n-1) \leq t_0\} P−=μ≥μ0supP{T≤t0}=P{t(n−1)≤t0}
- 考虑右侧假设 H 0 : μ ≤ μ 0 , H 1 : μ > μ 0 H_0:\mu \leq \mu_0,H_1:\mu>\mu_0 H0:μ≤μ0,H1:μ>μ0,拒绝域 W = { T = X ‾ − μ 0 S / n ≥ t α ( n − 1 ) } W=\left\{T=\dfrac{\overline{X}-\mu_0}{S/\sqrt{n}} \ge t_{\alpha}(n-1)\right\} W={T=S/nX−μ0≥tα(n−1)}, P − = sup μ ≤ μ 0 P { T ≥ t 0 } = P { t ( n − 1 ) ≥ t 0 } P_-=\displaystyle\sup_{\mu \leq \mu_0}{P\{T \ge t_0\}}=P\{t(n-1) \ge t_0\} P−=μ≤μ0supP{T≥t0}=P{t(n−1)≥t0}
- 方差
σ
2
\sigma^2
σ2 的假设检验,称为
χ
2
\chi^2
χ2 检验:
- 利用 σ 2 \sigma^2 σ2 的无偏估计 S 2 = 1 n − 1 ∑ i = 1 n ( X i − X ‾ ) 2 S^2=\dfrac{1}{n-1}\displaystyle\sum_{i=1}^n{(X_i-\overline{X})^2} S2=n−11i=1∑n(Xi−X)2,有 ( n − 1 ) S 2 σ 2 ∼ χ 2 ( n − 1 ) \dfrac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1) σ2(n−1)S2∼χ2(n−1),取检验统计量 χ 2 = ( n − 1 ) S 2 σ 0 2 \chi^2=\dfrac{(n-1)S^2}{\sigma_0^2} χ2=σ02(n−1)S2,代入样本值后的检验统计量 χ 0 2 = ( n − 1 ) s 2 σ 0 2 \chi_0^2=\dfrac{(n-1)s^2}{\sigma_0^2} χ02=σ02(n−1)s2,记 p 0 = P H 0 { χ 2 ( n − 1 ) ≤ χ 0 2 } p_0=P_{H_0}\{\chi^2(n-1) \leq \chi_0^2\} p0=PH0{χ2(n−1)≤χ02}
- 考虑双侧假设 H 0 : σ 2 = σ 0 2 , H 1 : σ 2 ≠ σ 0 2 H_0:\sigma^2=\sigma_0^2,H_1:\sigma^2 \ne \sigma_0^2 H0:σ2=σ02,H1:σ2=σ02,拒绝域 W = { χ 2 ≥ χ α / 2 2 ( n − 1 ) } ∪ { χ 2 ≤ χ 1 − α / 2 2 ( n − 1 ) } W=\{\chi^2 \ge \chi_{\alpha/2}^2(n-1)\} \cup \{\chi^2 \leq \chi_{1-\alpha/2}^2(n-1)\} W={χ2≥χα/22(n−1)}∪{χ2≤χ1−α/22(n−1)}, P − = 2 min ( p 0 , 1 − p 0 ) P_-=2\displaystyle\min(p_0,1-p_0) P−=2min(p0,1−p0)
- 考虑左侧假设 H 0 : σ 2 ≥ σ 0 2 , H 1 : σ 2 < σ 0 2 H_0:\sigma^2 \ge \sigma_0^2,H_1:\sigma^2<\sigma_0^2 H0:σ2≥σ02,H1:σ2<σ02,拒绝域 W = { χ 2 ≤ χ 1 − α 2 ( n − 1 ) } W=\{\chi^2 \leq \chi_{1-\alpha}^2(n-1)\} W={χ2≤χ1−α2(n−1)}, P − = p 0 P_-=p_0 P−=p0
- 考虑右侧假设 H 0 : σ 2 ≤ σ 0 2 , H 1 : σ 2 > σ 0 2 H_0:\sigma^2 \leq \sigma_0^2,H_1:\sigma^2>\sigma_0^2 H0:σ2≤σ02,H1:σ2>σ02,拒绝域 W = { χ 2 ≥ χ α 2 ( n − 1 ) } W=\{\chi^2 \ge \chi_{\alpha}^2(n-1)\} W={χ2≥χα2(n−1)}, P − = 1 − p 0 P_-=1-p_0 P−=1−p0
两个正态总体参数的假设检验
- 均值差
μ
1
−
μ
2
\mu_1-\mu_2
μ1−μ2 的假设检验(
σ
1
2
\sigma_1^2
σ12 和
σ
2
2
\sigma_2^2
σ22 已知):
- 检验统计量 X ‾ − Y ‾ ∼ N ( μ 1 − μ 2 , σ 1 2 n 1 + σ 2 2 n 2 ) \overline{X}-\overline{Y} \sim N\left(\mu_1-\mu_2, \dfrac{\sigma_1^2}{n_1}+\dfrac{\sigma_2^2}{n_2}\right) X−Y∼N(μ1−μ2,n1σ12+n2σ22)
- 考虑双侧假设 H 0 : μ 1 = μ 2 , H 1 : μ 1 ≠ μ 2 H_0:\mu_1=\mu_2, H_1:\mu_1 \ne \mu_2 H0:μ1=μ2,H1:μ1=μ2,当 H 0 H_0 H0 成立时 X ‾ − Y ‾ ∼ N ( 0 , σ 1 2 n 1 + σ 2 2 n 2 ) \overline{X}-\overline{Y} \sim N\left(0, \dfrac{\sigma_1^2}{n_1}+\dfrac{\sigma_2^2}{n_2}\right) X−Y∼N(0,n1σ12+n2σ22),利用 Z Z Z 检验,得到拒绝域 W = { ∣ X ‾ − Y ‾ ∣ σ 1 2 n 1 + σ 2 2 n 2 ≥ z α / 2 } W=\left\{\dfrac{|\overline{X}-\overline{Y}|}{\sqrt{\dfrac{\sigma_1^2}{n_1}+\dfrac{\sigma_2^2}{n_2}}} \ge z_{\alpha/2}\right\} W=⎩⎪⎪⎪⎪⎨⎪⎪⎪⎪⎧n1σ12+n2σ22∣X−Y∣≥zα/2⎭⎪⎪⎪⎪⎬⎪⎪⎪⎪⎫, P − = P H 0 { ∣ Z ∣ ≥ ∣ z 0 ∣ } = 2 P H 0 { Z ≥ ∣ z 0 ∣ } = 2 − 2 Φ ( ∣ z 0 ∣ ) P_-=P_{H_0}\{|Z| \ge |z_0|\}=2P_{H_0}\{Z \ge |z_0|\}=2-2\Phi(|z_0|) P−=PH0{∣Z∣≥∣z0∣}=2PH0{Z≥∣z0∣}=2−2Φ(∣z0∣)
- 均值差
μ
1
−
μ
2
\mu_1-\mu_2
μ1−μ2 的假设检验(
σ
1
2
=
σ
2
2
=
σ
2
\sigma_1^2=\sigma_2^2=\sigma^2
σ12=σ22=σ2 但未知),称为两样本精确
t
t
t 检验:
- 采用 σ 2 \sigma^2 σ2 的无偏估计 S w 2 = ( n 1 − 1 ) S 1 2 + ( n 2 − 1 ) S 2 2 n 1 + n 2 − 2 S_w^2=\dfrac{(n_1-1)S_1^2+(n_2-1)S_2^2}{n_1+n_2-2} Sw2=n1+n2−2(n1−1)S12+(n2−1)S22
- 考虑双侧假设 H 0 : μ 1 = μ 2 , H 1 : μ 1 ≠ μ 2 H_0:\mu_1=\mu_2, H_1:\mu_1 \ne \mu_2 H0:μ1=μ2,H1:μ1=μ2,取检验统计量 T = X ‾ − Y ‾ S w 1 n 1 + 1 n 2 T=\dfrac{\overline{X}-\overline{Y}}{S_w\sqrt{\dfrac{1}{n_1}+\dfrac{1}{n_2}}} T=Swn11+n21X−Y,当 H 0 H_0 H0 成立时 T ∼ t ( n 1 + n 2 − 2 ) T \sim t(n_1+n_2-2) T∼t(n1+n2−2),得到拒绝域 W = { ∣ T ∣ ≥ t α / 2 ( n 1 + n 2 − 2 ) } W=\{|T| \ge t_{\alpha/2}(n_1+n_2-2)\} W={∣T∣≥tα/2(n1+n2−2)}, P − = P H 0 { ∣ T ∣ ≥ ∣ t 0 ∣ } = 2 P H 0 { t ( n 1 + n 2 − 2 ) ≥ ∣ t 0 ∣ } P_-=P_{H_0}\{|T| \ge |t_0|\}=2P_{H_0}\{t(n_1+n_2-2) \ge |t_0|\} P−=PH0{∣T∣≥∣t0∣}=2PH0{t(n1+n2−2)≥∣t0∣}
- 方差比
σ
1
2
σ
2
2
\dfrac{\sigma_1^2}{\sigma_2^2}
σ22σ12 的假设检验:
- 取检验统计量 F = S 1 2 S 2 2 F=\dfrac{S_1^2}{S_2^2} F=S22S12,记代入样本值后的检验统计量 f 0 = s 1 2 s 2 2 f_0=\dfrac{s_1^2}{s_2^2} f0=s22s12,设 p 0 = P H 0 { F ≤ f 0 } = P { F ( n 1 − 1 , n 2 − 1 ) ≤ f 0 } p_0=P_{H_0}\{F \leq f_0\}=P\{F(n_1-1,n_2-1) \leq f_0\} p0=PH0{F≤f0}=P{F(n1−1,n2−1)≤f0}
- 考虑双侧假设 H 0 : σ 1 2 = σ 2 2 , H 1 : σ 1 2 ≠ σ 2 2 H_0:\sigma_1^2=\sigma_2^2, H_1:\sigma_1^2 \ne \sigma_2^2 H0:σ12=σ22,H1:σ12=σ22,当 H 0 H_0 H0 成立时 F ∼ F ( n 1 − 1 , n 2 − 1 ) F \sim F(n_1-1,n_2-1) F∼F(n1−1,n2−1),得到拒绝域 W = { F ≥ F α / 2 ( n 1 − 1 , n 2 − 1 ) } ∪ { F ≤ F 1 − α / 2 ( n 1 − 1 , n 2 − 1 ) } W=\{F \ge F_{\alpha/2}(n_1-1,n_2-1)\} \cup \{F \leq F_{1-\alpha/2}(n_1-1,n_2-1)\} W={F≥Fα/2(n1−1,n2−1)}∪{F≤F1−α/2(n1−1,n2−1)}, P − = 2 min ( p 0 , 1 − p 0 ) P_-=2\displaystyle\min(p_0, 1-p_0) P−=2min(p0,1−p0)
- 考虑左侧假设 H 0 : σ 1 2 ≥ σ 2 2 , H 1 : σ 1 2 < σ 2 2 H_0:\sigma_1^2 \ge \sigma_2^2, H_1:\sigma_1^2<\sigma_2^2 H0:σ12≥σ22,H1:σ12<σ22, P − = p 0 P_-=p_0 P−=p0
- 考虑右侧侧假设 H 0 : σ 1 2 ≤ σ 2 2 , H 1 : σ 1 2 > σ 2 2 H_0:\sigma_1^2 \leq \sigma_2^2, H_1:\sigma_1^2>\sigma_2^2 H0:σ12≤σ22,H1:σ12>σ22, P − = 1 − p 0 P_-=1-p_0 P−=1−p0