概率论的基本概念
事件频率
- 对任一事件 AAA:0≤fn(A)≤10 \leq f_n(A) \leq 10≤fn(A)≤1
- fn(S)=1f_n(S)=1fn(S)=1
- 当事件 AAA 和事件 BBB 不相容时,fn(A∪B)=fn(A)+fn(B)f_n(A \cup B)=f_n(A)+f_n(B)fn(A∪B)=fn(A)+fn(B)
- 推广:fn(⋃j=1kAj)=∑j=1kfn(Aj)f_n\left(\displaystyle\bigcup_{j=1}^k{A_j}\right)=\displaystyle\sum_{j=1}^k{f_n(A_j)}fn(j=1⋃kAj)=j=1∑kfn(Aj)
概率公理
- 非负性:P(A)≥0P(A) \ge 0P(A)≥0
- 规范性:P(S)=1P(S)=1P(S)=1
- 可列可加性:对 SSS 中的可列个两两不相容事件 A1,A2,…,An,…A_1,A_2,\dots,A_n,\dotsA1,A2,…,An,…,有 P(⋃j=1+∞Aj)=∑j=1+∞P(Aj)P\left(\displaystyle\bigcup_{j=1}^{+\infty}{A_j}\right)=\displaystyle\sum_{j=1}^{+\infty}{P(A_j)}P(j=1⋃+∞Aj)=j=1∑+∞P(Aj)
概率性质
- 对于有限个两两不相容的事件的和事件,有 P(⋃j=1nAj)=∑j=1nP(Aj)P\left(\displaystyle\bigcup_{j=1}^n{A_j}\right)=\displaystyle\sum_{j=1}^n{P(A_j)}P(j=1⋃nAj)=j=1∑nP(Aj)
- P(Aˉ)=1−P(A)P(\bar{A})=1-P(A)P(Aˉ)=1−P(A)
- 当 B⊂AB \subset AB⊂A 时,P(A−B)=P(A)−P(B)P(A-B)=P(A)-P(B)P(A−B)=P(A)−P(B),从而 P(A)≥P(B)P(A) \ge P(B)P(A)≥P(B)
证明:A=B∪ABˉ⇒∵B∩ABˉ=∅P(A)=P(B)+P(ABˉ)=P(B)+P(A−B)A=B \cup A\bar{B} \xRightarrow{\because B \cap A\bar{B}=\varnothing} P(A)=P(B)+P(A\bar{B})=P(B)+P(A-B)A=B∪ABˉ∵B∩ABˉ=∅P(A)=P(B)+P(ABˉ)=P(B)+P(A−B)
∴P(A−B)=P(A)−P(B)⇒∵P(A−B)≥0P(A)≥P(B)\therefore P(A-B)=P(A)-P(B) \xRightarrow{\because P(A-B) \ge 0} P(A) \ge P(B)∴P(A−B)=P(A)−P(B)∵P(A−B)≥0P(A)≥P(B) - 一般情况下:P(A−B)=P(A)−P(AB)P(A-B)=P(A)-P(AB)P(A−B)=P(A)−P(AB)
- 概率加法公式:P(A∪B)=P(A)+P(B)−P(AB)P(A \cup B)=P(A)+P(B)-P(AB)P(A∪B)=P(A)+P(B)−P(AB)
证明:{A=A∩(B∪Bˉ)=AB∪ABˉ⇒∵AB∩ABˉ=∅P(A)=P(AB)+P(ABˉ)A∪B=B∪ABˉ⇒∵B∩ABˉ=∅P(A∪B)=P(B)+P(ABˉ)\begin{cases}A=A \cap (B \cup \bar{B})=AB \cup A\bar{B} \xRightarrow{\because AB \cap A\bar{B}=\varnothing} P(A)=P(AB)+P(A\bar{B}) \\ A \cup B=B \cup A\bar{B} \xRightarrow{\because B \cap A\bar{B}=\varnothing} P(A \cup B)=P(B)+P(A\bar{B})\end{cases}{A=A∩(B∪Bˉ)=AB∪ABˉ∵AB∩ABˉ=∅P(A)=P(AB)+P(ABˉ)A∪B=B∪ABˉ∵B∩ABˉ=∅P(A∪B)=P(B)+P(ABˉ)
∴P(A∪B)=P(A)+P(B)−P(AB)\therefore P(A \cup B)=P(A)+P(B)-P(AB)∴P(A∪B)=P(A)+P(B)−P(AB) - 推广:P(⋃j=1nAj)=∑j=1nP(Aj)−∑i<jP(AiAj)+∑i<j<kP(AiAjAk)−⋯+(−1)n−1P(A1A2⋯An)P\left(\displaystyle\bigcup_{j=1}^n{A_j}\right)=\displaystyle\sum_{j=1}^n{P(A_j)}-\displaystyle\sum_{i<j}{P(A_iA_j)}+\displaystyle\sum_{i<j<k}{P(A_iA_jA_k)}- \cdots +(-1)^{n-1}P(A_1A_2 \cdots A_n)P(j=1⋃nAj)=j=1∑nP(Aj)−i<j∑P(AiAj)+i<j<k∑P(AiAjAk)−⋯+(−1)n−1P(A1A2⋯An)
条件概率
- 如果 P(B)>0P(B)>0P(B)>0,那么在 BBB 发生的条件下 AAA 发生的条件概率为 P(A∣B)=P(AB)P(B)P(A|B)=\dfrac{P(AB)}{P(B)}P(A∣B)=P(B)P(AB)
- 当 P(C)≠0P(C) \ne 0P(C)=0 时,有:
- P(A∣C)≥0P(A|C) \ge 0P(A∣C)≥0
- P(S∣C)=1P(S|C)=1P(S∣C)=1
- P(B∣C)=1−P(Bˉ∣C)P(B|C)=1-P(\bar{B}|C)P(B∣C)=1−P(Bˉ∣C)
- 当 A⊃BA \supset BA⊃B 时,P(A∣C)≥P(B∣C)P(A|C) \ge P(B|C)P(A∣C)≥P(B∣C)
- P(A∪B∣C)=P(A∣C)+P(B∣C)−P(AB∣C)P(A \cup B|C)=P(A|C)+P(B|C)-P(AB|C)P(A∪B∣C)=P(A∣C)+P(B∣C)−P(AB∣C)
- 特别地,若 AB=∅AB=\varnothingAB=∅,则 P(A∪B∣C)=P(A∣C)+P(B∣C)P(A \cup B|C)=P(A|C)+P(B|C)P(A∪B∣C)=P(A∣C)+P(B∣C)
- 乘法公式:当 P(A)≠0P(A) \ne 0P(A)=0 且 P(B)≠0P(B) \ne 0P(B)=0 时,P(AB)=P(A)⋅P(B∣A)=P(B)⋅P(A∣B)P(AB)=P(A) \cdot P(B|A)=P(B) \cdot P(A|B)P(AB)=P(A)⋅P(B∣A)=P(B)⋅P(A∣B)
- 全概率公式:设 SSS 为某一试验的样本空间,AAA 为该试验的事件,设 B1,B2,…,BnB_1,B_2,\dots,B_nB1,B2,…,Bn 是 SSS 的一个划分,且 P(Bj)>0P(B_j)>0P(Bj)>0,则 P(A)=∑j=1nP(Bj)P(A∣Bj)P(A)=\displaystyle\sum_{j=1}^n{P(B_j)P(A|B_j)}P(A)=j=1∑nP(Bj)P(A∣Bj)
证明:A=AS=A∩(⋃j=1nBj)=⋃j=1nABj⇒∵P(ABj)=P(Bj)⋅P(A∣Bj)P(A)∑j=1nP(Bj)P(A∣Bj)A=AS=A \cap \left(\displaystyle\bigcup_{j=1}^n{B_j}\right)=\displaystyle\bigcup_{j=1}^n{AB_j} \xRightarrow{\because P(AB_j)=P(B_j) \cdot P(A|B_j)} P(A)\displaystyle\sum_{j=1}^n{P(B_j)P(A|B_j)}A=AS=A∩(j=1⋃nBj)=j=1⋃nABj∵P(ABj)=P(Bj)⋅P(A∣Bj)P(A)j=1∑nP(Bj)P(A∣Bj) - 贝叶斯公式:设 SSS 为某一试验的样本空间,AAA 为该试验的事件且 P(A)≠0P(A) \ne 0P(A)=0,设 B1,B2,…,BnB_1,B_2,\dots,B_nB1,B2,…,Bn 是 SSS 的一个划分,且 P(Bj)>0P(B_j)>0P(Bj)>0,则 P(Bk∣A)=P(BkA)P(A)=P(Bk)P(A∣Bk)∑j=1nP(Bj)P(A∣Bj)P(B_k|A)=\dfrac{P(B_kA)}{P(A)}=\dfrac{P(B_k)P(A|B_k)}{\displaystyle\sum_{j=1}^n{P(B_j)P(A|B_j)}}P(Bk∣A)=P(A)P(BkA)=j=1∑nP(Bj)P(A∣Bj)P(Bk)P(A∣Bk)
事件的独立性
- 设 AAA 和 BBB 为两随机事件,当 P(AB)=P(A)⋅P(B)P(AB)=P(A) \cdot P(B)P(AB)=P(A)⋅P(B) 时称事件 AAA 和事件 BBB 相互独立
- 当 P(A)⋅P(B)≠0P(A) \cdot P(B) \ne 0P(A)⋅P(B)=0 时,“事件 AAA 和事件 BBB 相互独立”等价于条件概率等于无条件概率,即 P(B∣A)=P(B)P(B|A)=P(B)P(B∣A)=P(B) 或 P(A∣B)=P(A)P(A|B)=P(A)P(A∣B)=P(A)
- 当事件 AAA 和事件 BBB 相互独立时,AAA 和 Bˉ\bar{B}Bˉ、Aˉ\bar{A}Aˉ 和 BBB、Aˉ\bar{A}Aˉ 和 Bˉ\bar{B}Bˉ 均相互独立
- 设 A,B,CA,B,CA,B,C 为三个随机事件,当 {P(AB)=P(A)P(B)P(BC)=P(B)P(C)P(CA)=P(C)P(A)\begin{cases} P(AB)=P(A)P(B) \\ P(BC)=P(B)P(C) \\ P(CA)=P(C)P(A) \end{cases}⎩⎪⎨⎪⎧P(AB)=P(A)P(B)P(BC)=P(B)P(C)P(CA)=P(C)P(A) 都成立时,称事件 A,B,CA,B,CA,B,C 两两独立;如果还满足 P(ABC)=P(A)P(B)P(C)P(ABC)=P(A)P(B)P(C)P(ABC)=P(A)P(B)P(C),则称事件 A,B,CA,B,CA,B,C 相互独立
- 若 nnn 个事件 A1,A2,…,An(n≥2)A_1,A_2,\dots,A_n (n \ge 2)A1,A2,…,An(n≥2) 的任一子排列 Ai1,Ai2,…,Aik(2≤k≤n)A_{i_1},A_{i_2},\dots,A_{i_k} (2 \leq k \leq n)Ai1,Ai2,…,Aik(2≤k≤n) 都满足 P(Ai1Ai2⋯Aik)=∏j=1kP(Aij)P(A_{i_1}A_{i_2} \cdots A_{i_k})=\displaystyle\prod_{j=1}^k{P(A_{i_j})}P(Ai1Ai2⋯Aik)=j=1∏kP(Aij),则称事件 A1,A2,…,AnA_1,A_2,\dots,A_nA1,A2,…,An 相互独立
随机变量及其概率分布
二项分布
- 若随机变量 XXX 的概率分布律为 P{X=k}=Cnk(1−p)n−kpk (k∈N)P\{X=k\}=C_n^k(1-p)^{n-k}p^k \ (k \in \mathbb{N})P{X=k}=Cnk(1−p)n−kpk (k∈N),其中 0<p<10<p<10<p<1 且 n≥1n \ge 1n≥1,则称 XXX 服从参数为 (n,p)(n,p)(n,p) 的二项分布,记作 X∼B(n,p)X \sim B(n,p)X∼B(n,p)
泊松分布
- 若随机变量 XXX 的概率分布律为 P{X=k}=e−λ⋅λkk! (k∈N)P\{X=k\}=e^{-\lambda} \cdot \dfrac{\lambda^k}{k!} \ (k \in \mathbb{N})P{X=k}=e−λ⋅k!λk (k∈N),其中 λ>0\lambda>0λ>0,则称 XXX 服从参数为 λ\lambdaλ 的泊松分布,记作 X∼P(λ)X \sim P(\lambda)X∼P(λ)
- 当 nnn 足够大、ppp 足够小时,可以用泊松分布 P(np)P(np)P(np) 近似估计二项分布 B(n,p)B(n,p)B(n,p)
随机变量的分布函数
- F(x)=P{X≤x}=∑xi≤xP{X=xi} or ∫−∞xP{X=x}dxF(x)=P\{X \leq x\}=\displaystyle\sum_{x_i \leq x}{P\{X=x_i\}} \ \ \mathrm{or} \ \ \displaystyle\int_{-\infty}^x{P\{X=x\}\mathrm{d}x}F(x)=P{X≤x}=xi≤x∑P{X=xi} or ∫−∞xP{X=x}dx
- P{x1<X≤x2}=P{X≤x2}−P{X≤x1}=F(x2)−F(x1)P\{x_1<X \leq x_2\}=P\{X \leq x_2\}-P\{X \leq x_1\}=F(x_2)-F(x_1)P{x1<X≤x2}=P{X≤x2}−P{X≤x1}=F(x2)−F(x1)
- 分布函数的性质:
- F(x)F(x)F(x) 单调不减
- 0≤F(x)≤10 \leq F(x) \leq 10≤F(x)≤1,且满足 lima→−∞F(a)=0\displaystyle\lim_{a \to -\infty}{F(a)}=0a→−∞limF(a)=0 和 limb→+∞F(b)=1\displaystyle\lim_{b \to +\infty}{F(b)}=1b→+∞limF(b)=1
- F(x+0)=F(x)F(x+0)=F(x)F(x+0)=F(x),即 F(x)F(x)F(x) 右连续
连续型随机变量的密度函数
- 对于随机变量 XXX,其分布函数为 F(x)F(x)F(x),若存在一个非负的实函数 f(x)f(x)f(x),使得对任意实数 xxx,有 F(x)=∫−∞xf(t)dtF(x)=\displaystyle\int_{-\infty}^x{f(t)\mathrm{d}t}F(x)=∫−∞xf(t)dt,则称 f(x)f(x)f(x) 为连续型随机变量 XXX 的密度函数
- 密度函数的性质:
- f(x)≥0f(x) \ge 0f(x)≥0
- ∫−∞+∞f(t)dt=1\displaystyle\int_{-\infty}^{+\infty}{f(t)\mathrm{d}t}=1∫−∞+∞f(t)dt=1
- 对于任意实数 x1<x2x_1<x_2x1<x2,有 P{x1<X≤x2}=F(x2)−F(x1)=∫x1x2f(t)dtP\{x_1<X \leq x_2\}=F(x_2)-F(x_1)=\displaystyle\int_{x_1}^{x_2}{f(t)\mathrm{d}t}P{x1<X≤x2}=F(x2)−F(x1)=∫x1x2f(t)dt
- 若 f(x)f(x)f(x) 在 x=x0x=x_0x=x0 处连续,则 F′(x)=f(x)F'(x)=f(x)F′(x)=f(x)
- 由 F(x)F(x)F(x) 的连续性可以推出 P{X=a}=0P\{X=a\}=0P{X=a}=0,即连续型随机变量取任一定值的概率为零
均匀分布
- 设随机变量 XXX 具有密度函数 f(x)={1b−a,x∈(a,b)0,otherwisef(x)=\begin{cases}\dfrac{1}{b-a}, x \in (a,b) \\ 0, otherwise\end{cases}f(x)=⎩⎨⎧b−a1,x∈(a,b)0,otherwise,则称 XXX 服从区间 (a,b)(a,b)(a,b) 上的均匀分布,记作 X∼U(a,b)X \sim U(a,b)X∼U(a,b)
- 均匀分布的分布函数:F(x)={0,x<ax−ab−a,a≤x<b1,x≥bF(x)=\begin{cases}0, &x<a \\ \dfrac{x-a}{b-a}, &a \leq x<b \\ 1, &x \ge b\end{cases}F(x)=⎩⎪⎪⎨⎪⎪⎧0,b−ax−a,1,x<aa≤x<bx≥b
正态分布
- 设随机变量 XXX 具有密度函数 f(x)=12πσexp[−(x−μ)22σ2]f(x)=\dfrac{1}{\sqrt{2\pi}\sigma}\exp\left[-\dfrac{(x-\mu)^2}{2\sigma^2}\right]f(x)=2πσ1exp[−2σ2(x−μ)2],其中 σ>0\sigma>0σ>0 且 ∣μ∣<+∞|\mu|<+\infty∣μ∣<+∞,则称 XXX 服从参数为 (μ,σ)(\mu,\sigma)(μ,σ) 的正态分布,记作 X∼N(μ,σ2)X \sim N(\mu,\sigma^2)X∼N(μ,σ2)
- 正态分布密度函数的性质:
- f(x)f(x)f(x) 关于 x=μx=\mux=μ 对称
- max∣x∣<+∞f(x)=f(μ)=12πσ\displaystyle\max_{|x|<+\infty}{f(x)}=f(\mu)=\dfrac{1}{\sqrt{2\pi}\sigma}∣x∣<+∞maxf(x)=f(μ)=2πσ1
- lim∣x−μ∣→+∞f(x)=0\displaystyle\lim_{|x-\mu| \to +\infty}{f(x)}=0∣x−μ∣→+∞limf(x)=0
- 标准正态分布 Z∼N(0,1)Z \sim N(0,1)Z∼N(0,1),密度函数 φ(x)=12πexp(−x22)\varphi(x)=\dfrac{1}{\sqrt{2\pi}}\exp\left(-\dfrac{x^2}{2}\right)φ(x)=2π1exp(−2x2),分布函数 Φ(x)=12πexp(−x22)\Phi(x)=\dfrac{1}{\sqrt{2\pi}}\exp\left(-\dfrac{x^2}{2}\right)Φ(x)=2π1exp(−2x2)
- 根据对称性,Φ(−x)=P{Z≤−x}=P{Z≥x}=1−Φ(x)\Phi(-x)=P\{Z \leq -x\}=P\{Z \ge x\}=1-\Phi(x)Φ(−x)=P{Z≤−x}=P{Z≥x}=1−Φ(x)
- 对于一般正态分布 X∼N(μ,σ2)X \sim N(\mu,\sigma^2)X∼N(μ,σ2),P{a<X<b}=Φ(b−μσ)−Φ(a−μσ)P\{a<X<b\}=\Phi\left(\dfrac{b-\mu}{\sigma}\right)-\Phi\left(\dfrac{a-\mu}{\sigma}\right)P{a<X<b}=Φ(σb−μ)−Φ(σa−μ)
- 若 zαz_\alphazα 满足 Φ(zα)=1−α\Phi(z_\alpha)=1-\alphaΦ(zα)=1−α,称 zαz_\alphazα 为标准正态分布的上 α\alphaα 分位数
指数分布
- 设随机变量 XXX 具有密度函数 f(x)={λe−λx,x>00,x≤0f(x)=\begin{cases}\lambda e^{-\lambda x}, &x>0 \\ 0, &x \leq 0\end{cases}f(x)={λe−λx,0,x>0x≤0,其中 λ>0\lambda>0λ>0,则称 XXX 服从参数为 λ\lambdaλ 的指数分布,记作 X∼E(λ)X \sim E(\lambda)X∼E(λ)
- 指数分布的分布函数:F(x)={1−e−λx,x>00,x≤0F(x)=\begin{cases}1-e^{-\lambda x}, &x>0 \\ 0, &x \leq 0\end{cases}F(x)={1−e−λx,0,x>0x≤0
- 指数分布具有无记忆性:P{X>t0+t}=P{X>t0}⋅P{X>t}P\{X>t_0+t\}=P\{X>t_0\} \cdot P\{X>t\}P{X>t0+t}=P{X>t0}⋅P{X>t}
随机变量函数的分布
- 设 XXX 为一连续型随机变量,其密度函数为 fX(x)f_X(x)fX(x),随机变量 Y=g(X)Y=g(X)Y=g(X)。若函数 y=g(x)y=g(x)y=g(x) 为一严格单调递增(或单调递减)函数,且处处可微,记其反函数为 x=h(y)x=h(y)x=h(y),则 YYY 的密度函数为 fY(y)={fX(h(y))⋅∣h′(y)∣,y∈D0,y∉Df_Y(y)=\begin{cases}f_X(h(y)) \cdot |h'(y)|, &y \in D \\ 0, &y \not\in D\end{cases}fY(y)={fX(h(y))⋅∣h′(y)∣,0,y∈Dy∈D,其中 DDD 为函数 y=g(x)y=g(x)y=g(x) 的值域
多元随机变量及其分布
二元离散型随机变量
- 设二元离散型随机变量 (X,Y)(X,Y)(X,Y) 的可能取值为 (xi,yj)(x_i,y_j)(xi,yj),其中 i,j∈N+i,j \in \mathbb{N}^+i,j∈N+,称 P{X=xi,Y=yj}=pijP\{X=x_i, Y=y_j\}=p_{ij}P{X=xi,Y=yj}=pij 为 (X,Y)(X,Y)(X,Y) 的联合分布律
- 二元离散型随机变量的边际分布:
- P{X=xi}=P(⋃j=1+∞{X=xi,Y=yj})=∑j=1+∞pij≜pi⋅P\{X=x_i\}=P\left(\displaystyle\bigcup_{j=1}^{+\infty}{\{X=x_i, Y=y_j\}}\right)=\displaystyle\sum_{j=1}^{+\infty}{p_{ij}} \triangleq p_{i \cdot}P{X=xi}=P(j=1⋃+∞{X=xi,Y=yj})=j=1∑+∞pij≜pi⋅
- P{Y=yj}=P(⋃i=1+∞{X=xi,Y=yj})=∑i=1+∞pij≜p⋅jP\{Y=y_j\}=P\left(\displaystyle\bigcup_{i=1}^{+\infty}{\{X=x_i, Y=y_j\}}\right)=\displaystyle\sum_{i=1}^{+\infty}{p_{ij}} \triangleq p_{\cdot j}P{Y=yj}=P(i=1⋃+∞{X=xi,Y=yj})=i=1∑+∞pij≜p⋅j
- 二元离散型随机变量的条件分布:
- P{X=xi∣Y=yj}=P{X=xi,Y=yj}P{Y=yj}=pijp⋅jP\{X=x_i|Y=y_j\}=\dfrac{P\{X=x_i, Y=y_j\}}{P\{Y=y_j\}}=\dfrac{p_{ij}}{p_{\cdot j}}P{X=xi∣Y=yj}=P{Y=yj}P{X=xi,Y=yj}=p⋅jpij
- P{Y=yj∣X=xi}=P{X=xi,Y=yj}P{X=xi}=pijpi⋅P\{Y=y_j|X=x_i\}=\dfrac{P\{X=x_i, Y=y_j\}}{P\{X=x_i\}}=\dfrac{p_{ij}}{p_{i \cdot}}P{Y=yj∣X=xi}=P{X=xi}P{X=xi,Y=yj}=pi⋅pij
二元随机变量的分布函数
- 二元随机变量的联合分布函数:设二元随机变量 (X,Y)(X,Y)(X,Y),对于任意实数 x,yx, yx,y,称函数 F(x,y)=P{X≤x,Y≤y}F(x,y)=P\{X \leq x, Y \leq y\}F(x,y)=P{X≤x,Y≤y} 为 (X,Y)(X,Y)(X,Y) 的联合分布函数
- 二元联合分布函数的性质:
- 对于固定的 x=x0x=x_0x=x0,F(x0,y)F(x_0, y)F(x0,y) 关于 yyy 单调不减
- 对于固定的 y=y0y=y_0y=y0,F(x,y0)F(x, y_0)F(x,y0) 关于 xxx 单调不减
- 0≤F(x,y)≤10 \leq F(x,y) \leq 10≤F(x,y)≤1
- F(x,−∞)=F(−∞,y)=F(−∞,−∞)=0,F(+∞,+∞)=1F(x, -\infty)=F(-\infty, y)=F(-\infty, -\infty)=0, F(+\infty, +\infty)=1F(x,−∞)=F(−∞,y)=F(−∞,−∞)=0,F(+∞,+∞)=1
- F(x+0,y)=F(x,y)F(x+0, y)=F(x, y)F(x+0,y)=F(x,y),即 F(x,y)F(x,y)F(x,y) 关于 xxx 右连续
- F(x,y+0)=F(x,y)F(x, y+0)=F(x, y)F(x,y+0)=F(x,y),即 F(x,y)F(x,y)F(x,y) 关于 yyy 右连续
- 对于实数 x1<x2x_1<x_2x1<x2 和 y1<y2y_1<y_2y1<y2,P{x1<X≤x2,y1<Y≤y2}=F(x2,y2)−F(x1,y2)−F(x2,y1)+F(x1,y1)P\{x_1<X \leq x_2, y_1<Y \leq y_2\}=F(x_2,y_2)-F(x_1,y_2)-F(x_2,y_1)+F(x_1,y_1)P{x1<X≤x2,y1<Y≤y2}=F(x2,y2)−F(x1,y2)−F(x2,y1)+F(x1,y1)
- 二元边际分布函数:
- FX(x)=P{X≤x}=P{X≤x,Y≤+∞}=F(x,+∞)F_X(x)=P\{X \leq x\}=P\{X \leq x, Y \leq +\infty\}=F(x, +\infty)FX(x)=P{X≤x}=P{X≤x,Y≤+∞}=F(x,+∞)
- FY(y)=P{Y≤y}=P{X≤+∞,Y≤y}=F(+∞,y)F_Y(y)=P\{Y \leq y\}=P\{X \leq +\infty, Y \leq y\}=F(+\infty, y)FY(y)=P{Y≤y}=P{X≤+∞,Y≤y}=F(+∞,y)
- 二元条件分布函数:FY∣X(y∣xi)=P{Y≤y∣X=xi} or limδ→0+P{Y≤y∣xi<X≤xi+δ}F_{Y|X}(y|x_i)=P\{Y \leq y|X=x_i\} \ \ \mathrm{or} \ \ \displaystyle\lim_{\delta \to 0^+}{P\{Y \leq y|x_i<X \leq x_i+\delta\}}FY∣X(y∣xi)=P{Y≤y∣X=xi} or δ→0+limP{Y≤y∣xi<X≤xi+δ}
二元连续型随机变量
- 设二元随机变量 (X,Y)(X,Y)(X,Y) 的联合分布函数为 F(x,y)F(x,y)F(x,y),若存在二元函数 f(x,y)≥0f(x,y) \ge 0f(x,y)≥0,对任意实数 x,yx,yx,y 有 F(x,y)=∫−∞x∫−∞yf(u,v)dudvF(x,y)=\displaystyle\int_{-\infty}^x\displaystyle\int_{-\infty}^y{f(u,v)\mathrm{d}u\mathrm{d}v}F(x,y)=∫−∞x∫−∞yf(u,v)dudv,则称 f(x,y)f(x,y)f(x,y) 为 (X,Y)(X,Y)(X,Y) 的联合密度函数
- 联合密度函数的性质:
- f(x,y)≥0f(x,y) \ge 0f(x,y)≥0
- ∫−∞+∞∫−∞+∞f(u,v)dudv=F(+∞,+∞)=1\displaystyle\int_{-\infty}^{+\infty}\displaystyle\int_{-\infty}^{+\infty}{f(u,v)\mathrm{d}u\mathrm{d}v}=F(+\infty,+\infty)=1∫−∞+∞∫−∞+∞f(u,v)dudv=F(+∞,+∞)=1
- 若 F(x,y)F(x,y)F(x,y) 在 (x,y)(x,y)(x,y) 处连续,则 ∂2F(x,y)∂x∂y=f(x,y)\dfrac{\partial^2 F(x,y)}{\partial x \partial y}=f(x,y)∂x∂y∂2F(x,y)=f(x,y)
- (X,Y)(X,Y)(X,Y) 落入 xOyxOyxOy 平面任一区域 DDD 的概率为 P{(X,Y)∈D}=∬Df(x,y)dxdyP\{(X,Y) \in D\}=\displaystyle\iint_D{f(x,y)\mathrm{d}x\mathrm{d}y}P{(X,Y)∈D}=∬Df(x,y)dxdy
- 二元连续型随机变量的边际分布:
- FX(x)=P{X≤x}=P{X≤x,Y≤+∞}=∫−∞x[∫−∞+∞f(x,y)dy]dxF_X(x)=P\{X \leq x\}=P\{X \leq x, Y \leq +\infty\}=\displaystyle\int_{-\infty}^{x}{\left[\displaystyle\int_{-\infty}^{+\infty}{f(x,y)\mathrm{d}y}\right]\mathrm{d}x}FX(x)=P{X≤x}=P{X≤x,Y≤+∞}=∫−∞x[∫−∞+∞f(x,y)dy]dx
- fX(x)=∫−∞+∞f(x,y)dyf_X(x)=\displaystyle\int_{-\infty}^{+\infty}{f(x,y)\mathrm{d}y}fX(x)=∫−∞+∞f(x,y)dy
- FY(y)=P{Y≤y}=P{X≤+∞,Y≤y}=∫−∞y[∫−∞+∞f(x,y)dx]dyF_Y(y)=P\{Y \leq y\}=P\{X \leq +\infty, Y \leq y\}=\displaystyle\int_{-\infty}^{y}{\left[\displaystyle\int_{-\infty}^{+\infty}{f(x,y)\mathrm{d}x}\right]\mathrm{d}y}FY(y)=P{Y≤y}=P{X≤+∞,Y≤y}=∫−∞y[∫−∞+∞f(x,y)dx]dy
- fY(y)=∫−∞+∞f(x,y)dxf_Y(y)=\displaystyle\int_{-\infty}^{+\infty}{f(x,y)\mathrm{d}x}fY(y)=∫−∞+∞f(x,y)dx
- 条件密度函数:
- fY∣X(y∣x)=f(x,y)fX(x),fX(x)≠0f_{Y|X}(y|x)=\dfrac{f(x,y)}{f_X(x)}, f_X(x) \ne 0fY∣X(y∣x)=fX(x)f(x,y),fX(x)=0
- fX∣Y(x∣y)=f(x,y)fY(y),fY(y)≠0f_{X|Y}(x|y)=\dfrac{f(x,y)}{f_Y(y)}, f_Y(y) \ne 0fX∣Y(x∣y)=fY(y)f(x,y),fY(y)=0
- 设二元随机变量 (X,Y)(X,Y)(X,Y) 具有联合密度函数 f(x,y)=12πσ1σ21−ρ2exp{−12(1−ρ2)[(x−μ1)2σ12−2ρ(x−μ1)(y−μ2)σ1σ2+(y−μ2)2σ22]}f(x,y)=\dfrac{1}{2\pi\sigma_1\sigma_2\sqrt{1-\rho^2}}\exp\left\{-\dfrac{1}{2(1-\rho^2)}\left[\dfrac{(x-\mu_1)^2}{\sigma_1^2}-2\rho\dfrac{(x-\mu_1)(y-\mu_2)}{\sigma_1\sigma_2}+\dfrac{(y-\mu_2)^2}{\sigma_2^2}\right]\right\}f(x,y)=2πσ1σ21−ρ21exp{−2(1−ρ2)1[σ12(x−μ1)2−2ρσ1σ2(x−μ1)(y−μ2)+σ22(y−μ2)2]},其中 ∣μ1∣,∣μ2∣<+∞|\mu_1|,|\mu_2|<+\infty∣μ1∣,∣μ2∣<+∞,σ1,σ2>0\sigma_1,\sigma_2>0σ1,σ2>0,∣ρ∣<1|\rho|<1∣ρ∣<1,则称 (X,Y)(X,Y)(X,Y) 服从参数为 (μ1,μ2,σ12,σ22,ρ)(\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,\rho)(μ1,μ2,σ12,σ22,ρ) 的二元正态分布,记为 (X,Y)∼N(μ1,μ2,σ12,σ22,ρ)(X,Y) \sim N(\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,\rho)(X,Y)∼N(μ1,μ2,σ12,σ22,ρ)
- X,YX,YX,Y 的边际分布也是正态分布:X∼N(μ1,σ12),Y∼N(μ2,σ22)X \sim N(\mu_1,\sigma_1^2), Y \sim N(\mu_2,\sigma_2^2)X∼N(μ1,σ12),Y∼N(μ2,σ22)
- 当给定 {X=x}\{X=x\}{X=x} 的条件下,YYY 的条件分布也是正态分布:Y∣X=x∼N(μ2+ρσ1σ2(x−μ1),(1−ρ2)σ22)Y|X=x \sim N\left(\mu_2+\rho\dfrac{\sigma_1}{\sigma_2}(x-\mu_1),(1-\rho^2)\sigma_2^2\right)Y∣X=x∼N(μ2+ρσ2σ1(x−μ1),(1−ρ2)σ22)
- 当给定 {Y=y}\{Y=y\}{Y=y} 的条件下,XXX 的条件分布也是正态分布:X∣Y=y∼N(μ1+ρσ1σ2(y−μ2),(1−ρ2)σ12)X|Y=y \sim N\left(\mu_1+\rho\dfrac{\sigma_1}{\sigma_2}(y-\mu_2),(1-\rho^2)\sigma_1^2\right)X∣Y=y∼N(μ1+ρσ2σ1(y−μ2),(1−ρ2)σ12)
随机变量的独立性
- 对于任意两个实数集合 D1,D2D_1,D2D1,D2,若 P{X∈D1,Y∈D2}=P{X∈D1}⋅P{Y∈D2}P\{X \in D_1,Y \in D_2\}=P\{X \in D_1\} \cdot P\{Y \in D_2\}P{X∈D1,Y∈D2}=P{X∈D1}⋅P{Y∈D2},则称随机变量 X,YX,YX,Y 相互独立
- 当 F(x,y)=FX(x)⋅FY(y)F(x,y)=F_X(x) \cdot F_Y(y)F(x,y)=FX(x)⋅FY(y) 时,X,YX,YX,Y 相互独立
- 对于连续型随机变量,被积的密度函数在除了面积为零的区域外处处相等,即 f(x,y)=fX(x)⋅fY(y)f(x,y)=f_X(x) \cdot f_Y(y)f(x,y)=fX(x)⋅fY(y),为相互独立的等价定义
- 二元连续型随机变量 X,YX,YX,Y 相互独立的充要条件是 X,YX,YX,Y 的联合密度函数 f(x,y)f(x,y)f(x,y) 几乎处处可写成关于 xxx 的函数 m(x)m(x)m(x) 和关于 yyy 的函数 n(y)n(y)n(y),即 f(x,y)=m(x)⋅n(y),∣x∣<+∞,∣y∣<+∞,f(x,y)≠0f(x,y)=m(x) \cdot n(y), |x|<+\infty, |y|<+\infty, f(x,y) \ne 0f(x,y)=m(x)⋅n(y),∣x∣<+∞,∣y∣<+∞,f(x,y)=0
二元随机变量函数的分布
- Z=X+YZ=X+YZ=X+Y:
- fZ(z)=∫−∞+∞f(x,z−x)dxf_Z(z)=\displaystyle\int_{-\infty}^{+\infty}{f(x,z-x)\mathrm{d}x}fZ(z)=∫−∞+∞f(x,z−x)dx
- fZ(z)=∫−∞+∞f(z−y,y)dyf_Z(z)=\displaystyle\int_{-\infty}^{+\infty}{f(z-y,y)\mathrm{d}y}fZ(z)=∫−∞+∞f(z−y,y)dy
- M=max(X,Y)M=\max(X,Y)M=max(X,Y):
- FM(t)=P{max(X,Y)≤t}=P{X≤t,Y≤t}=F(t,t)F_M(t)=P\{\max(X,Y) \leq t\}=P\{X \leq t, Y \leq t\}=F(t,t)FM(t)=P{max(X,Y)≤t}=P{X≤t,Y≤t}=F(t,t)
- 若 X,YX,YX,Y 相互独立,则 FM(t)=Fx(t)⋅FY(t)F_M(t)=F_x(t) \cdot F_Y(t)FM(t)=Fx(t)⋅FY(t)
- N=min(X,Y)N=\min(X,Y)N=min(X,Y):
- FN(t)=P{min(X,Y)≤t}=1−P{min(X,Y)>t}=1−P{X>t,Y>t}F_N(t)=P\{\min(X,Y) \leq t\}=1-P\{\min(X,Y)>t\}=1-P\{X>t, Y>t\}FN(t)=P{min(X,Y)≤t}=1−P{min(X,Y)>t}=1−P{X>t,Y>t}
- 若 X,YX,YX,Y 相互独立,则 FN(t)=1−[1−FX(t)]⋅[1−FY(t)]F_N(t)=1-[1-F_X(t)] \cdot [1-F_Y(t)]FN(t)=1−[1−FX(t)]⋅[1−FY(t)]
随机变量的数字特征
期望
- E(X)=∑i=1+∞xipi or ∫−∞+∞xf(x)dxE(X)=\displaystyle\sum_{i=1}^{+\infty}{x_ip_i} \ \ \mathrm{or} \ \ \displaystyle\int_{-\infty}^{+\infty}{xf(x)\mathrm{d}x}E(X)=i=1∑+∞xipi or ∫−∞+∞xf(x)dx
- 泊松分布的期望:E(X)=∑k=0+∞k⋅(e−λ⋅λkk!)=λe−λ∑k=1+∞λk−1(k−1)!=λe−λ⋅eλ=λE(X)=\displaystyle\sum_{k=0}^{+\infty}{k \cdot \left(e^{-\lambda} \cdot \dfrac{\lambda^k}{k!}\right)}=\lambda e^{-\lambda}\displaystyle\sum_{k=1}^{+\infty}{\dfrac{\lambda^{k-1}}{(k-1)!}}=\lambda e^{-\lambda} \cdot e^{\lambda}=\lambdaE(X)=k=0∑+∞k⋅(e−λ⋅k!λk)=λe−λk=1∑+∞(k−1)!λk−1=λe−λ⋅eλ=λ
- 指数分布的期望:E(X)=∫0+∞x⋅λe−λx⋅dx=x⋅(−e−λx)∣0+∞−∫0+∞−e−λxdx=−1λe−λx∣0+∞=1λE(X)=\displaystyle\int_0^{+\infty}{x \cdot \lambda e^{-\lambda x} \cdot \mathrm{d}x}=\left.x \cdot (-e^{-\lambda x})\right|_0^{+\infty}-\displaystyle\int_0^{+\infty}{-e^{-\lambda x}\mathrm{d}x}=\left.-\dfrac1\lambda e^{-\lambda x}\right|_0^{+\infty}=\dfrac1\lambdaE(X)=∫0+∞x⋅λe−λx⋅dx=x⋅(−e−λx)∣∣0+∞−∫0+∞−e−λxdx=−λ1e−λx∣∣∣∣0+∞=λ1
- 标准正态分布的期望:E(Z)=∫−∞+∞z⋅φ(z)dz=∵f(−z)=−zφ(z)=−f(z)0E(Z)=\displaystyle\int_{-\infty}^{+\infty}{z \cdot \varphi(z)\mathrm{d}z} \xlongequal{\because f(-z)=-z\varphi(z)=-f(z)} 0E(Z)=∫−∞+∞z⋅φ(z)dz∵f(−z)=−zφ(z)=−f(z)0
- 随机变量函数的期望:E(g(X))=∑i=1+∞g(xi)pi or ∫−∞+∞g(x)f(x)dxE(g(X))=\displaystyle\sum_{i=1}^{+\infty}{g(x_i)p_i} \ \ \mathrm{or} \ \ \displaystyle\int_{-\infty}^{+\infty}{g(x)f(x)\mathrm{d}x}E(g(X))=i=1∑+∞g(xi)pi or ∫−∞+∞g(x)f(x)dx
- 二元随机变量函数的期望:E(h(X,Y))=∑i=1+∞∑j=1+∞h(xi,yi)pij or ∫−∞+∞∫−∞+∞h(x,y)f(x,y)dxdyE(h(X,Y))=\displaystyle\sum_{i=1}^{+\infty}\displaystyle\sum_{j=1}^{+\infty}{h(x_i, y_i)p_{ij}} \ \ \mathrm{or} \ \ \displaystyle\int_{-\infty}^{+\infty}\displaystyle\int_{-\infty}^{+\infty}{h(x,y)f(x,y)\mathrm{d}x\mathrm{d}y}E(h(X,Y))=i=1∑+∞j=1∑+∞h(xi,yi)pij or ∫−∞+∞∫−∞+∞h(x,y)f(x,y)dxdy
- 期望的性质:E(c0+∑i=1nciXi)=c0+∑i=1nciE(Xi)E\left(c_0+\displaystyle\sum_{i=1}^{n}{c_iX_i}\right)=c_0+\displaystyle\sum_{i=1}^{n}{c_iE(X_i)}E(c0+i=1∑nciXi)=c0+i=1∑nciE(Xi)
- 正态分布的期望:X∼N(μ,σ2)⇒Z=X−μσ∼N(0,1)E(X)=E(σZ+μ)=σE(Z)+μ=μX \sim N(\mu, \sigma^2) \xRightarrow{Z=\frac{X-\mu}{\sigma} \sim N(0,1)} E(X)=E(\sigma Z+\mu)=\sigma E(Z)+\mu=\muX∼N(μ,σ2)Z=σX−μ∼N(0,1)E(X)=E(σZ+μ)=σE(Z)+μ=μ
- 二项分布的期望:E(X)=E(∑i=1nXi)=∑i=1nE(Xi)=∑i=1np=npE(X)=E\left(\displaystyle\sum_{i=1}^{n}{X_i}\right)=\displaystyle\sum_{i=1}^{n}{E(X_i)}=\displaystyle\sum_{i=1}^{n}{p}=npE(X)=E(i=1∑nXi)=i=1∑nE(Xi)=i=1∑np=np
- 对于独立变量:E(∏i=1nXi)=∏i=1nE(Xi)E\left(\displaystyle\prod_{i=1}^{n}{X_i}\right)=\displaystyle\prod_{i=1}^{n}{E(X_i)}E(i=1∏nXi)=i=1∏nE(Xi)
方差
- Var(X)=D(X)=E[(X−E(X))2]\mathrm{Var}(X)=D(X)=E[(X-E(X))^2]Var(X)=D(X)=E[(X−E(X))2]
- 标准差:σ(X)=D(X)\sigma(X)=\sqrt{D(X)}σ(X)=D(X)
- D(X)=E[X2−2X⋅E(X)+E2(X)]=E(X2)−E(X)⋅2E(X)+E2(X)=E(X2)−E2(X)D(X)=E[X^2-2X \cdot E(X)+E^2(X)]=E(X^2)-E(X) \cdot 2E(X)+E^2(X)=E(X^2)-E^2(X)D(X)=E[X2−2X⋅E(X)+E2(X)]=E(X2)−E(X)⋅2E(X)+E2(X)=E(X2)−E2(X)
- 泊松分布的方差:E(X2)=∑k=0+∞k2⋅(e−λ⋅λkk!)=λe−λ∑k=1+∞[(k−1)+1]⋅λk−1(k−1)!=λe−λ[λ∑k=2+∞λk−2(k−2)!+∑k=1+∞λk−1(k−1)!]=λe−λ(λeλ+eλ)=λ2+λ⇒E(X)=λD(X)=λE(X^2)=\displaystyle\sum_{k=0}^{+\infty}{k^2 \cdot \left(e^{-\lambda} \cdot \dfrac{\lambda^k}{k!}\right)}=\lambda e^{-\lambda}\displaystyle\sum_{k=1}^{+\infty}{[(k-1)+1] \cdot \dfrac{\lambda^{k-1}}{(k-1)!}}=\lambda e^{-\lambda}\left[\lambda\displaystyle\sum_{k=2}^{+\infty}{\dfrac{\lambda^{k-2}}{(k-2)!}}+\displaystyle\sum_{k=1}^{+\infty}{\dfrac{\lambda^{k-1}}{(k-1)!}}\right]=\lambda e^{-\lambda}\left(\lambda e^{\lambda}+e^{\lambda}\right)=\lambda^2+\lambda \xRightarrow{E(X)=\lambda} D(X)=\lambdaE(X2)=k=0∑+∞k2⋅(e−λ⋅k!λk)=λe−λk=1∑+∞[(k−1)+1]⋅(k−1)!λk−1=λe−λ[λk=2∑+∞(k−2)!λk−2+k=1∑+∞(k−1)!λk−1]=λe−λ(λeλ+eλ)=λ2+λE(X)=λD(X)=λ
- 指数分布的方差:E(X2)=∫0+∞x2⋅λe−λx⋅dx=x2⋅(−e−λx)∣0+∞−∫0+∞2x⋅(−e−λx)dx=2∫0+∞xe−λxdx=2λE(X)⇒E(X)=1λD(X)=1λ2E(X^2)=\displaystyle\int_0^{+\infty}{x^2 \cdot \lambda e^{-\lambda x} \cdot \mathrm{d}x}=\left.x^2 \cdot (-e^{-\lambda x})\right|_0^{+\infty}-\displaystyle\int_0^{+\infty}{2x \cdot (-e^{-\lambda x})\mathrm{d}x}=2\displaystyle\int_0^{+\infty}{xe^{-\lambda x}\mathrm{d}x}=\dfrac2\lambda E(X) \xRightarrow{E(X)=\frac1\lambda} D(X)=\dfrac1{\lambda^2}E(X2)=∫0+∞x2⋅λe−λx⋅dx=x2⋅(−e−λx)∣∣0+∞−∫0+∞2x⋅(−e−λx)dx=2∫0+∞xe−λxdx=λ2E(X)E(X)=λ1D(X)=λ21
- 标准正态分布的方差:D(X)=1D(X)=1D(X)=1
- 方差的性质:D(c0+∑i=1nciXi)=∑i=1nci2D(Xi)D\left(c_0+\displaystyle\sum_{i=1}^{n}{c_iX_i}\right)=\displaystyle\sum_{i=1}^{n}{c_i^2D(X_i)}D(c0+i=1∑nciXi)=i=1∑nci2D(Xi)
- 二项分布的方差:D(X)=D(∑i=1nXi)=∑i=1nD(Xi)=∑i=1np(1−p)=np(1−p)D(X)=D\left(\displaystyle\sum_{i=1}^{n}{X_i}\right)=\displaystyle\sum_{i=1}^{n}{D(X_i)}=\displaystyle\sum_{i=1}^{n}{p(1-p)}=np(1-p)D(X)=D(i=1∑nXi)=i=1∑nD(Xi)=i=1∑np(1−p)=np(1−p)
协方差
- Cov(X,Y)=E[(X−E(X))(Y−E(Y))]=E(XY)−E(X)E(Y)\mathrm{Cov}(X,Y)=E[(X-E(X))(Y-E(Y))]=E(XY)-E(X)E(Y)Cov(X,Y)=E[(X−E(X))(Y−E(Y))]=E(XY)−E(X)E(Y)
- 离散型:Cov(X,Y)=∑i=1+∞∑j=1+∞(xi−E(X))(yj−E(Y))pij\mathrm{Cov}(X,Y)=\displaystyle\sum_{i=1}^{+\infty}\displaystyle\sum_{j=1}^{+\infty}{(x_i-E(X))(y_j-E(Y))p_{ij}}Cov(X,Y)=i=1∑+∞j=1∑+∞(xi−E(X))(yj−E(Y))pij
- 连续型:Cov(X,Y)=∫−∞+∞∫−∞+∞(x−E(X))(y−E(Y))f(x,y)dxdy\mathrm{Cov}(X,Y)=\displaystyle\int_{-\infty}^{+\infty}\displaystyle\int_{-\infty}^{+\infty}{(x-E(X))(y-E(Y))f(x,y)\mathrm{d}x\mathrm{d}y}Cov(X,Y)=∫−∞+∞∫−∞+∞(x−E(X))(y−E(Y))f(x,y)dxdy
- 设 X1,X2,…,XnX_1,X_2,\dots,X_nX1,X2,…,Xn 为方差存在的随机变量,则 Var(∑i=1nXi)=∑i=1nVar(Xi)+2∑1≤i<j≤nCov(Xi,Xj)\mathrm{Var}\left(\displaystyle\sum_{i=1}^n{X_i}\right)=\displaystyle\sum_{i=1}^n{\mathrm{Var}(X_i)}+2\displaystyle\sum_{1 \leq i<j \leq n}{\mathrm{Cov}(X_i, X_j)}Var(i=1∑nXi)=i=1∑nVar(Xi)+21≤i<j≤n∑Cov(Xi,Xj)
- 协方差的性质:
- Cov(X,Y)=Cov(Y,X)\mathrm{Cov}(X, Y)=\mathrm{Cov}(Y, X)Cov(X,Y)=Cov(Y,X)
- Cov(X,X)=Var(X)\mathrm{Cov}(X, X)=\mathrm{Var}(X)Cov(X,X)=Var(X)
- Cov(aX,bY)=abCov(X,Y)\mathrm{Cov}(aX, bY)=ab\mathrm{Cov}(X, Y)Cov(aX,bY)=abCov(X,Y)
- 若 Cov(Xi,Y)\mathrm{Cov}(X_i, Y)Cov(Xi,Y) 存在,则 Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y)\mathrm{Cov}(X_1+X_2, Y)=\mathrm{Cov}(X_1, Y)+\mathrm{Cov}(X_2, Y)Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y)
- 若 X,YX,YX,Y 相互独立,则 Cov(X,Y)=0\mathrm{Cov}(X,Y)=0Cov(X,Y)=0,但反之不然
- 当 Var(X)⋅Var(Y)≠0\mathrm{Var}(X) \cdot \mathrm{Var}(Y) \ne 0Var(X)⋅Var(Y)=0 时,有 Var2(X,Y)≤Var(X)⋅Var(Y)\mathrm{Var}^2(X,Y) \leq \mathrm{Var}(X) \cdot \mathrm{Var}(Y)Var2(X,Y)≤Var(X)⋅Var(Y),等号成立当且仅当 X,YX,YX,Y 之间有严格的线性关系,即存在常数 c1,c2c_1,c_2c1,c2 使得 P{Y=c1+c2X}=1P\{Y=c_1+c_2X\}=1P{Y=c1+c2X}=1
相关系数
- 对于随机变量 X,YX,YX,Y,当 E(X2),E(Y2)E(X^2),E(Y^2)E(X2),E(Y2) 均存在,且 Var(X),Var(Y)≠0\mathrm{Var}(X),\mathrm{Var}(Y) \ne 0Var(X),Var(Y)=0 时,称 ρXY=Cov(X,Y)Var(X)Var(Y)\rho_{XY}=\dfrac{\mathrm{Cov}(X,Y)}{\sqrt{\mathrm{Var}(X)}\sqrt{\mathrm{Var}(Y)}}ρXY=Var(X)Var(Y)Cov(X,Y)
- 标准化定义:ρXY=Cov(X∗,Y∗)\rho_{XY}=\mathrm{Cov}(X^*,Y^*)ρXY=Cov(X∗,Y∗),其中 X∗=X−E(X)D(X),Y∗=Y−E(Y)D(Y)X^*=\dfrac{X-E(X)}{\sqrt{D(X)}},Y^*=\dfrac{Y-E(Y)}{\sqrt{D(Y)}}X∗=D(X)X−E(X),Y∗=D(Y)Y−E(Y)
- 相关系数的性质:
- 若 X,YX,YX,Y 相互独立,则 ρXY=0\rho_{XY}=0ρXY=0,但反之不然
- ∣ρXY∣≤1|\rho_{XY}| \leq 1∣ρXY∣≤1,等号成立当且仅当 X,YX,YX,Y 之间有严格的线性关系,即存在常数 c1,c2c_1,c_2c1,c2 使得 P{Y=c1+c2X}=1P\{Y=c_1+c_2X\}=1P{Y=c1+c2X}=1
- 当随机变量 X,YX,YX,Y 的相关系数 ρXY=0\rho_{XY}=0ρXY=0 时,称 X,YX,YX,Y 不相关,等价定义:
- Cov(X,Y)=0\mathrm{Cov}(X,Y)=0Cov(X,Y)=0
- E(XY)=E(X)E(Y)E(XY)=E(X)E(Y)E(XY)=E(X)E(Y)
- D(X+Y)=D(X)+D(Y)D(X+Y)=D(X)+D(Y)D(X+Y)=D(X)+D(Y)
上 α\alphaα 分位数
- 设连续型随机变量的分布函数 F(x)F(x)F(x) 和密度函数 f(x)f(x)f(x),对任意 0<α<10<\alpha<10<α<1,称满足条件 1−F(xα)=∫xα+∞f(x)dx=α1-F(x_\alpha)=\displaystyle\int_{x_\alpha}^{+\infty}{f(x)\mathrm{d}x}=\alpha1−F(xα)=∫xα+∞f(x)dx=α 的实数 xαx_\alphaxα 为随机变量 XXX 的上 α\alphaα 分位数
- 由正态分布对称性,z1−α=−zαz_{1-\alpha}=-z_\alphaz1−α=−zα
协方差矩阵
-
记 nnn 元随机变量 X=(X1,X2,⋯ ,Xn)T\bm{X}=(X_1,X_2,\cdots,X_n)^TX=(X1,X2,⋯,Xn)T,若其每一分量的方差都存在,则称 Cov(X)=E[(X−E(X))(X−E(X))T]=[Cov(Xi,Xj)]n×n\mathrm{Cov}(\bm{X})=E[(\bm{X}-E(\bm{X}))(\bm{X}-E(\bm{X}))^T]=[\mathrm{Cov}(X_i,X_j)]_{n \times n}Cov(X)=E[(X−E(X))(X−E(X))T]=[Cov(Xi,Xj)]n×n 为 nnn 元随机变量 X\bm{X}X 的协方差矩阵
-
nnn 元随机变量 X=(X1,X2,⋯ ,Xn)T\bm{X}=(X_1,X_2,\cdots,X_n)^TX=(X1,X2,⋯,Xn)T,它的每一分量的方差都存在,记 X\bm{X}X 的协方差矩阵为 B=Cov(X)\bm{B}=\mathrm{Cov}(\bm{X})B=Cov(X),数学期望为 a=E(X)=(E(X1),E(X2),…,E(Xn))T\bm{a}=E(\bm{X})=(E(X_1),E(X_2),\dots,E(X_n))^Ta=E(X)=(E(X1),E(X2),…,E(Xn))T,则由密度函数 f(x)=1(2π)n∣B∣exp[−12(x−a)TB−1(x−a)]f(\bm{x})=\dfrac{1}{\sqrt{(2\pi)^n|\bm{B}|}}\exp\left[-\dfrac12(\bm{x}-\bm{a})^T\bm{B}^{-1}(\bm{x}-\bm{a})\right]f(x)=(2π)n∣B∣1exp[−21(x−a)TB−1(x−a)] 定义的分布为 nnn 元正态分布,常记为 X∼N(a,B)\bm{X} \sim N(\bm{a},\bm{B})X∼N(a,B),其中 x=(x1,x2,…,xn)T\bm{x}=(x_1,x_2,\dots,x_n)^Tx=(x1,x2,…,xn)T,∣B∣=detB|\bm{B}|=\det\bm{B}∣B∣=detB
- 二元正态分布的协方差矩阵:B=(σ12σ1σ2ρσ2σ1ρσ22)\bm{B}=\begin{pmatrix}\sigma_1^2 & \sigma_1\sigma_2\rho \\ \sigma_2\sigma_1\rho & \sigma_2^2\end{pmatrix}B=(σ12σ2σ1ρσ1σ2ρσ22)
- nnn 元正态变量 (X1,X2,⋯ ,Xn)T(X_1,X_2,\cdots,X_n)^T(X1,X2,⋯,Xn)T 中的任意 kkk 元子向量 (Xi1,Xi2,…,Xik)T(X_{i_1},X_{i_2},\dots,X_{i_k})^T(Xi1,Xi2,…,Xik)T 也服从 kkk 元正态分布;特别地,nnn 元正态变量的每一个分量都服从一元正态分布;反之,若 XiX_iXi 都是相互独立的正态变量,则 (X1,X2,⋯ ,Xn)T(X_1,X_2,\cdots,X_n)^T(X1,X2,⋯,Xn)T 服从 nnn 元正态分布
- X=(X1,X2,⋯ ,Xn)T\bm{X}=(X_1,X_2,\cdots,X_n)^TX=(X1,X2,⋯,Xn)T 服从 nnn 元正态分布的充要条件是任意关于分量的线性组合均服从一元正态分布,即对任意 nnn 元实向量 l=(l1,l2,…,ln)T\bm{l}=(l_1,l_2,\dots,l_n)^Tl=(l1,l2,…,ln)T,其中 ∣l∣≠0|\bm{l}| \ne 0∣l∣=0,有 X∼N(a,B) ⟺ lTB=∑i=1nliXi∼N(lTa,lTBl)\bm{X} \sim N(\bm{a},\bm{B}) \iff \bm{l}^T\bm{B}=\displaystyle\sum_{i=1}^n{l_iX_i} \sim N(\bm{l}^T\bm{a},\bm{l}^T\bm{B}\bm{l})X∼N(a,B)⟺lTB=i=1∑nliXi∼N(lTa,lTBl)
- 正态变量线性变换不变性:对于 nnn 元正态变量 X=(X1,X2,⋯ ,Xn)T\bm{X}=(X_1,X_2,\cdots,X_n)^TX=(X1,X2,⋯,Xn)T,若 Y1,Y2,…,YkY_1,Y_2,\dots,Y_kY1,Y2,…,Yk 都是 X1,X2,…,XnX_1,X_2,\dots,X_nX1,X2,…,Xn 的线性函数,则 Y=(Y1,Y2,…,Yk)T\bm{Y}=(Y_1,Y_2,\dots,Y_k)^TY=(Y1,Y2,…,Yk)T 服从 kkk 元正态分布,用矩阵形式表述,若 X∼N(a,B),C=[cij]k×n\bm{X} \sim N(\bm{a},\bm{B}),\bm{C}=[c_{ij}]_{k \times n}X∼N(a,B),C=[cij]k×n,则 Y=CX∼N(Ca,CBCT)\bm{Y}=\bm{C}\bm{X} \sim N(\bm{C}\bm{a},\bm{C}\bm{B}\bm{C}^T)Y=CX∼N(Ca,CBCT)
大数定律及中心极限定理
依概率收敛
- 设 {Yn,n≥1}\{Y_n, n\ge 1\}{Yn,n≥1} 为一随机变量序列,ccc 为一常数,若对任意的 ε>0\varepsilon>0ε>0,都有 limn→+∞P{∣Yn−c∣≥ε}=0\displaystyle\lim_{n \to +\infty}{P\{|Y_n-c| \ge \varepsilon\}}=0n→+∞limP{∣Yn−c∣≥ε}=0 成立,则称 {Yn,n≥1}\{Y_n, n\ge 1\}{Yn,n≥1} 依概率收敛于 ccc,记为 Yn→Pc,n→+∞Y_n \xrightarrow{P} c, n \to +\inftyYnPc,n→+∞
- 等价表示:limn→+∞P{∣Yn−c∣<ε}=1\displaystyle\lim_{n \to +\infty}{P\{|Y_n-c|<\varepsilon\}}=1n→+∞limP{∣Yn−c∣<ε}=1
- 设 Xn→Pa,Yn→Pb,n→+∞X_n \xrightarrow{P} a, Y_n \xrightarrow{P} b, n \to +\inftyXnPa,YnPb,n→+∞,其中 a,ba,ba,b 为常数,若二元函数 g(x,y)g(x,y)g(x,y) 在点 (a,b)(a,b)(a,b) 处连续,则有 g(Xn,Yn)→Pg(a,b),n→+∞g(X_n,Y_n) \xrightarrow{P} g(a,b), n \to +\inftyg(Xn,Yn)Pg(a,b),n→+∞
马尔可夫(Markov)不等式
- 若随机变量 YYY 的 kkk 阶(原点)矩存在,则对任意的 ε>0\varepsilon>0ε>0,有 P{∣Y∣≥ε}≤E(∣Y∣k)εkP\{|Y| \ge \varepsilon\} \leq \dfrac{E(|Y|^k)}{\varepsilon^k}P{∣Y∣≥ε}≤εkE(∣Y∣k)
- 证明:构造 Z={ε,∣Y∣≥ε0,∣Y∣<εZ=\begin{cases}\varepsilon, & |Y| \ge \varepsilon \\ 0, & |Y|<\varepsilon\end{cases}Z={ε,0,∣Y∣≥ε∣Y∣<ε,则 Zk≤∣Y∣kZ^k \leq |Y|^kZk≤∣Y∣k,故 E(Zk)≤E(∣Y∣k)E(Z^k) \leq E(|Y|^k)E(Zk)≤E(∣Y∣k),注意到 E(Zk)=εk⋅P{∣Y∣≥ε}E(Z^k)=\varepsilon^k \cdot P\{|Y| \ge \varepsilon\}E(Zk)=εk⋅P{∣Y∣≥ε},因此 P{∣Y∣≥ε}=E(Zk)εk≤E(∣Y∣k)εkP\{|Y| \ge \varepsilon\}=\dfrac{E(Z^k)}{\varepsilon^k} \leq \dfrac{E(|Y|^k)}{\varepsilon^k}P{∣Y∣≥ε}=εkE(Zk)≤εkE(∣Y∣k)
切比雪夫(Chebyshev)不等式
- 设随机变量 XXX 存在期望 μ\muμ 和方差 σ2\sigma^2σ2,则对任意的 ε>0\varepsilon>0ε>0,有 P{∣X−μ∣≥ε}≤σ2ε2P\{|X-\mu| \ge \varepsilon\} \leq \dfrac{\sigma^2}{\varepsilon^2}P{∣X−μ∣≥ε}≤ε2σ2
- 证明:取 Y=X−μ,k=2Y=X-\mu,k=2Y=X−μ,k=2,利用马尔可夫不等式即可
弱大数定律
- 设随机变量序列 {Yi,i≥1}\{Y_i, i \ge 1\}{Yi,i≥1},若存在常数序列 {cn,n≥1}\{c_n, n \ge 1\}{cn,n≥1},使得对任意的 ε>0\varepsilon>0ε>0,有 limn→+∞P{∣1n∑i=1nYi−cn∣≥ε}=0\displaystyle\lim_{n \to +\infty}{P\left\{\left|\dfrac1n\displaystyle\sum_{i=1}^n{Y_i}-c_n\right| \ge \varepsilon\right\}}=0n→+∞limP{∣∣∣∣∣n1i=1∑nYi−cn∣∣∣∣∣≥ε}=0,则称 {Yi,i≥1}\{Y_i, i \ge 1\}{Yi,i≥1} 服从弱大数定律,记作 1n∑i=1nYi−cn→P0,n→+∞\dfrac1n\displaystyle\sum_{i=1}^n{Y_i}-c_n \xrightarrow{P} 0, n \to +\inftyn1i=1∑nYi−cnP0,n→+∞
- 特别地,当 cn≡cc_n \equiv ccn≡c 时,可记为 1n∑i=1nYi→Pc,n→+∞\dfrac1n\displaystyle\sum_{i=1}^n{Y_i} \xrightarrow{P} c, n \to +\inftyn1i=1∑nYiPc,n→+∞
伯努利(Bernoulli)大数定律
- 设 nAn_AnA 为 nnn 重伯努利试验中事件 AAA 发生的次数,ppp 为事件 AAA 发生的概率,则对任意的 ε>0\varepsilon>0ε>0,有 limn→+∞P{∣nAn−p∣≥ε}=0\displaystyle\lim_{n \to +\infty}{P\left\{\left|\dfrac{n_A}{n}-p\right| \ge \varepsilon\right\}}=0n→+∞limP{∣∣∣nnA−p∣∣∣≥ε}=0
辛钦(Khinchin)大数定律
- 设 {Xi,i≥1}\{X_i, i \ge 1\}{Xi,i≥1} 为独立同分布的随机变量序列,且存在期望 μ\muμ,则对任意的 ε>0\varepsilon>0ε>0,有 limn→+∞P{∣1n∑i=1nXi−μ∣≥ε}=0\displaystyle\lim_{n \to +\infty}{P\left\{\left|\dfrac1n\displaystyle\sum_{i=1}^n{X_i}-\mu\right| \ge \varepsilon\right\}}=0n→+∞limP{∣∣∣∣∣n1i=1∑nXi−μ∣∣∣∣∣≥ε}=0
林德伯格(Lindeberg)-莱维(Lévy)中心极限定理
- 设 {Xi,i≥1}\{X_i, i \ge 1\}{Xi,i≥1} 为独立同分布的随机变量序列,且存在期望 E(Xi)=μE(X_i)=\muE(Xi)=μ 和方差 D(Xi)=σ2D(X_i)=\sigma^2D(Xi)=σ2,则对任意的 x∈Rx \in \mathbb{R}x∈R,limn→+∞P{∑i=1nXi−E(∑i=1nXi)D(∑i=1nXi)≤x}=limn→+∞P{∑i=1nXi−nμσn≤x}=Φ(x)\displaystyle\lim_{n \to +\infty}{P\left\{\dfrac{\displaystyle\sum_{i=1}^n{X_i}-E\left(\displaystyle\sum_{i=1}^n{X_i}\right)}{\sqrt{D\left(\displaystyle\sum_{i=1}^n{X_i}\right)}} \leq x\right\}}=\displaystyle\lim_{n \to +\infty}{P\left\{\dfrac{\displaystyle\sum_{i=1}^n{X_i}-n\mu}{\sigma\sqrt{n}} \leq x\right\}}=\Phi(x)n→+∞limP⎩⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎧D(i=1∑nXi)i=1∑nXi−E(i=1∑nXi)≤x⎭⎪⎪⎪⎪⎪⎬⎪⎪⎪⎪⎪⎫=n→+∞limP⎩⎪⎪⎪⎪⎨⎪⎪⎪⎪⎧σni=1∑nXi−nμ≤x⎭⎪⎪⎪⎪⎬⎪⎪⎪⎪⎫=Φ(x)
- 推论:当 nnn 充分大时,∑i=1nXi−nμσn=1n∑i=1nXi−μσ/n=X‾−μσ/n∼N(0,1)\dfrac{\displaystyle\sum_{i=1}^n{X_i}-n\mu}{\sigma\sqrt{n}}=\dfrac{\dfrac1n\displaystyle\sum_{i=1}^n{X_i}-\mu}{\sigma/\sqrt{n}}=\dfrac{\overline{X}-\mu}{\sigma/\sqrt{n}} \sim N(0,1)σni=1∑nXi−nμ=σ/nn1i=1∑nXi−μ=σ/nX−μ∼N(0,1)
棣莫弗(De Moivre)-拉普拉斯(Laplace)中心极限定理
- 设 nAn_AnA 为 nnn 重伯努利试验中事件 AAA 发生的次数,ppp 为事件 AAA 发生的概率,则对任意的 x∈Rx \in \mathbb{R}x∈R,有 limn→+∞P{nA−npnp(1−p)≤x}=Φ(x)\displaystyle\lim_{n \to +\infty}{P\left\{\dfrac{n_A-np}{\sqrt{np(1-p)}} \leq x\right\}}=\Phi(x)n→+∞limP{np(1−p)nA−np≤x}=Φ(x)
统计量与抽样分布
统计量
- 样本均值 X‾=1n∑i=1nXi\overline{X}=\dfrac1n\displaystyle\sum_{i=1}^n{X_i}X=n1i=1∑nXi
- 样本方差 S2=1n−1∑i=1n(Xi−X‾)2=1n−1(∑i=1nXi2−nX‾2)S^2=\dfrac1{n-1}\displaystyle\sum_{i=1}^n{(X_i-\overline{X})^2}=\dfrac1{n-1}\left(\displaystyle\sum_{i=1}^n{X_i^2}-n\overline{X}^2\right)S2=n−11i=1∑n(Xi−X)2=n−11(i=1∑nXi2−nX2)
- 样本标准差 S=S2=1n−1∑i=1n(Xi−X‾)2S=\sqrt{S^2}=\sqrt{\dfrac1{n-1}\displaystyle\sum_{i=1}^n{(X_i-\overline{X})^2}}S=S2=n−11i=1∑n(Xi−X)2
- 样本 kkk 阶(原点)矩 Ak=1n∑i=1nXik,k∈N+A_k=\dfrac1n\displaystyle\sum_{i=1}^n{X_i^k}, k \in \mathbb{N}^+Ak=n1i=1∑nXik,k∈N+
- 样本 kkk 阶中心矩 Bk=1n∑i=1n(Xi−X‾)k,k∈N+B_k=\dfrac1n\displaystyle\sum_{i=1}^n{(X_i-\overline{X})^k}, k \in \mathbb{N}^+Bk=n1i=1∑n(Xi−X)k,k∈N+
χ2\chi^2χ2 分布
- 设 X1,X2,…,XnX_1,X_2,\dots,X_nX1,X2,…,Xn 为独立同分布的随机变量,且都服从 N(0,1)N(0,1)N(0,1),令 Y=X12+X22+⋯+Xn2Y=X_1^2+X_2^2+\cdots+X_n^2Y=X12+X22+⋯+Xn2,则称 YYY 服从自由度为 nnn 的 χ2\chi^2χ2 分布,记作 Y∼χ2(n)Y \sim \chi^2(n)Y∼χ2(n)
- E(χ2(n))=∑i=1nE(Xi2)=∑i=1n[E(Xi)+D(Xi)]=nE(\chi^2(n))=\displaystyle\sum_{i=1}^n{E(X_i^2)}=\displaystyle\sum_{i=1}^n{[E(X_i)+D(X_i)]}=nE(χ2(n))=i=1∑nE(Xi2)=i=1∑n[E(Xi)+D(Xi)]=n
- D(χ2(n))=∑i=1nD(Xi2)=∑i=1n[E(Xi4)−(E(Xi2))2]=∵E(Z4)=32nD(\chi^2(n))=\displaystyle\sum_{i=1}^n{D(X_i^2)}=\displaystyle\sum_{i=1}^n{[E(X_i^4)-(E(X_i^2))^2]} \xlongequal{\because E(Z^4)=3} 2nD(χ2(n))=i=1∑nD(Xi2)=i=1∑n[E(Xi4)−(E(Xi2))2]∵E(Z4)=32n
ttt 分布
- 设 X∼N(0,1),Y∼χ2(n)X \sim N(0,1), Y \sim \chi^2(n)X∼N(0,1),Y∼χ2(n),且 X,YX,YX,Y 相互独立,则称随机变量 t=XY/nt=\dfrac{X}{\sqrt{Y/n}}t=Y/nX 服从自由度为 nnn 的 ttt 分布,记作 t∼t(n)t \sim t(n)t∼t(n)
- t1−α(n)=−tα(n)t_{1-\alpha}(n)=-t_\alpha(n)t1−α(n)=−tα(n)
FFF 分布
- 设 U∼χ2(n1),V∼χ2(n2)U \sim \chi^2(n_1), V \sim \chi^2(n_2)U∼χ2(n1),V∼χ2(n2),且 U,VU,VU,V 相互独立,则称随机变量 F=U/n1V/n2F=\dfrac{U/n_1}{V/n_2}F=V/n2U/n1 服从自由度为 (n1,n2)(n_1,n_2)(n1,n2) 的 FFF 分布,记作 F∼F(n1,n2)F \sim F(n_1,n_2)F∼F(n1,n2)
- 若 F∼F(n1,n2)F \sim F(n_1,n_2)F∼F(n1,n2),则 1F∼F(n2,n1)\dfrac1F \sim F(n_2,n_1)F1∼F(n2,n1)
- 若 X∼t(n)X \sim t(n)X∼t(n),则 X2∼F(1,n)X^2 \sim F(1,n)X2∼F(1,n)
- F1−α(n1,n2)=1Fα(n2,n1)F_{1-\alpha}(n_1,n_2)=\dfrac{1}{F_\alpha(n_2,n_1)}F1−α(n1,n2)=Fα(n2,n1)1
正态总体下的抽样分布
- 设 X1,X2,…,XnX_1,X_2,\dots,X_nX1,X2,…,Xn 为来自正态总体 N(μ,σ2)N(\mu,\sigma^2)N(μ,σ2) 的简单随机样本,样本均值 X‾\overline{X}X,样本方差 S2S^2S2,则有
- X‾∼N(μ,σ2n)\overline{X} \sim N\left(\mu, \dfrac{\sigma^2}{n}\right)X∼N(μ,nσ2)
- (n−1)S2σ2∼χ2(n−1)\dfrac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)σ2(n−1)S2∼χ2(n−1)
- X‾\overline{X}X 与 S2S^2S2 相互独立
- X‾−μS/n=X‾−μσ2/n/(n−1)S2σ2(n−1)∼t(n−1)\dfrac{\overline{X}-\mu}{S/\sqrt{n}}=\left.\dfrac{\overline{X}-\mu}{\sqrt{\sigma^2/n}} \middle/ \sqrt{\dfrac{(n-1)S^2}{\sigma^2(n-1)}} \right.\sim t(n-1)S/nX−μ=σ2/nX−μ/σ2(n−1)(n−1)S2∼t(n−1)
- 设 X1,X2,…,Xn1X_1,X_2,\dots,X_{n_1}X1,X2,…,Xn1 和 Y1,Y2,…,Yn2Y_1,Y_2,\dots,Y_{n_2}Y1,Y2,…,Yn2 分别为来自正态总体 N(μ1,σ12)N(\mu_1,\sigma_1^2)N(μ1,σ12) 和 N(μ2,σ22)N(\mu_2,\sigma_2^2)N(μ2,σ22) 的简单随机样本,样本均值 X‾\overline{X}X 和 Y‾\overline{Y}Y,样本方差 S12S_1^2S12 和 S22S_2^2S22,则有
- S12/σ12S22/σ22=(n1−1)S12σ12/(n1−1)(n2−1)S22σ22/(n2−1)∼F(n1−1,n2−1)\dfrac{S_1^2/\sigma_1^2}{S_2^2/\sigma_2^2}=\dfrac{\left.\dfrac{(n_1-1)S_1^2}{\sigma_1^2} \middle/ (n_1-1)\right.}{\left.\dfrac{(n_2-1)S_2^2}{\sigma_2^2} \middle/ (n_2-1)\right.} \sim F(n_1-1,n_2-1)S22/σ22S12/σ12=σ22(n2−1)S22/(n2−1)σ12(n1−1)S12/(n1−1)∼F(n1−1,n2−1)
- 当 σ12=σ22=σ2\sigma_1^2=\sigma_2^2=\sigma^2σ12=σ22=σ2 时,X‾−Y‾∼N(μ1−μ2,σ2n1+σ2n2)\overline{X}-\overline{Y} \sim N\left(\mu_1-\mu_2,\dfrac{\sigma^2}{n_1}+\dfrac{\sigma^2}{n_2}\right)X−Y∼N(μ1−μ2,n1σ2+n2σ2),令 U=(X‾−Y‾)−(μ1−μ2)σ2n1+σ2n2∼N(0,1)U=\dfrac{(\overline{X}-\overline{Y})-(\mu_1-\mu_2)}{\sqrt{\dfrac{\sigma^2}{n_1}+\dfrac{\sigma^2}{n_2}}} \sim N(0,1)U=n1σ2+n2σ2(X−Y)−(μ1−μ2)∼N(0,1) 和 V=(n1−1)S12σ2+(n2−1)S22σ2∼χ2(n1+n2−2)V=\dfrac{(n_1-1)S_1^2}{\sigma^2}+\dfrac{(n_2-1)S_2^2}{\sigma^2} \sim \chi^2(n_1+n_2-2)V=σ2(n1−1)S12+σ2(n2−1)S22∼χ2(n1+n2−2),记 Sw2=(n1−1)S12+(n2−1)S22n1+n2−2S_w^2=\dfrac{(n_1-1)S_1^2+(n_2-1)S_2^2}{n_1+n_2-2}Sw2=n1+n2−2(n1−1)S12+(n2−1)S22,则 (X‾−Y‾)−(μ1−μ2)Sw1n1+1n2=UV/(n1+n2−2)∼t(n1+n2−2)\dfrac{(\overline{X}-\overline{Y})-(\mu_1-\mu_2)}{S_w\sqrt{\dfrac{1}{n_1}+\dfrac{1}{n_2}}}=\dfrac{U}{\sqrt{V/(n_1+n_2-2)}} \sim t(n_1+n_2-2)Swn11+n21(X−Y)−(μ1−μ2)=V/(n1+n2−2)U∼t(n1+n2−2)
参数估计
矩估计
- 设 θ1,θ2,…,θm\theta_1,\theta_2,\dots,\theta_mθ1,θ2,…,θm 是总体 XXX 的带估计参数,并假定 XXX 的前 mmm 阶矩存在,矩估计的步骤如下:
- 求总体 XXX 的前 mmm 阶矩(不妨设是原点矩)μ1,μ2,…,μm\mu_1,\mu_2,\dots,\mu_mμ1,μ2,…,μm,一般地,这些矩可以写成待估计参数 θ1,θ2,…,θm\theta_1,\theta_2,\dots,\theta_mθ1,θ2,…,θm 的函数形式,记为 {μ1=E(X)=g1(θ1,θ2,…,θm)μ2=E(X2)=g2(θ1,θ2,…,θm)⋯⋯μm=E(Xm)=gm(θ1,θ2,…,θm)\begin{cases}\mu_1=E(X)=g_1(\theta_1,\theta_2,\dots,\theta_m) \\ \mu_2=E(X^2)=g_2(\theta_1,\theta_2,\dots,\theta_m) \\ \cdots \cdots \\ \mu_m=E(X^m)=g_m(\theta_1,\theta_2,\dots,\theta_m)\end{cases}⎩⎪⎪⎪⎨⎪⎪⎪⎧μ1=E(X)=g1(θ1,θ2,…,θm)μ2=E(X2)=g2(θ1,θ2,…,θm)⋯⋯μm=E(Xm)=gm(θ1,θ2,…,θm)
- 由上述方程组可以反解出 θ1,θ2,…,θm\theta_1,\theta_2,\dots,\theta_mθ1,θ2,…,θm 关于前 mmm 阶矩的函数表达式,记为 {θ1=h1(μ1,μ2,…,μm)θ2=h2(μ1,μ2,…,μm)⋯⋯θm=hm(μ1,μ2,…,μm)\begin{cases}\theta_1=h_1(\mu_1,\mu_2,\dots,\mu_m) \\ \theta_2=h_2(\mu_1,\mu_2,\dots,\mu_m) \\ \cdots \cdots \\ \theta_m=h_m(\mu_1,\mu_2,\dots,\mu_m)\end{cases}⎩⎪⎪⎪⎨⎪⎪⎪⎧θ1=h1(μ1,μ2,…,μm)θ2=h2(μ1,μ2,…,μm)⋯⋯θm=hm(μ1,μ2,…,μm)
- 以原点矩 AiA_iAi 代替 μi\mu_iμi,得到各个参数的点估计量 {θ^1=h1(A1,A2,…,Am)θ^2=h2(A1,A2,…,Am)⋯⋯θ^m=hm(A1,A2,…,Am)\begin{cases}\hat{\theta}_1=h_1(A_1,A_2,\dots,A_m) \\ \hat{\theta}_2=h_2(A_1,A_2,\dots,A_m) \\ \cdots \cdots \\ \hat{\theta}_m=h_m(A_1,A_2,\dots,A_m)\end{cases}⎩⎪⎪⎪⎨⎪⎪⎪⎧θ^1=h1(A1,A2,…,Am)θ^2=h2(A1,A2,…,Am)⋯⋯θ^m=hm(A1,A2,…,Am)
- 矩估计中也可以用部分总体中心距 νi\nu_iνi 代替原点矩 μi\mu_iμi,用样本中心距 BiB_iBi 代替原点矩 AiA_iAi
极大似然估计
- 似然函数 L(θ)L(\theta)L(θ):
- 设 XXX 为离散型总体,其概率分布律为 P{X=x}=p(x;θ)P\{X=x\}=p(x;\theta)P{X=x}=p(x;θ),θ∈Θ\theta \in \Thetaθ∈Θ 是未知的待估参数,Θ\ThetaΘ 为参数空间,X1,X2,…,XnX_1,X_2,\dots,X_nX1,X2,…,Xn 是来自总体 XXX 的样本,设 x1,x2,…,xnx_1,x_2,\dots,x_nx1,x2,…,xn 是已经得到的样本值,则样本 X1,X2,…,XnX_1,X_2,\dots,X_nX1,X2,…,Xn 取到值 x1,x2,…,xnx_1,x_2,\dots,x_nx1,x2,…,xn 的概率为 P{X1=x1,X2=x2,…,Xn=xn}=∏i=1nP{Xi=xi}=∏i=1np(xi;θ)P\{X_1=x_1,X_2=x_2,\dots,X_n=x_n\}=\displaystyle\prod_{i=1}^n{P\{X_i=x_i\}}=\displaystyle\prod_{i=1}^n{p(x_i;\theta)}P{X1=x1,X2=x2,…,Xn=xn}=i=1∏nP{Xi=xi}=i=1∏np(xi;θ),记似然函数 L(θ)=L(θ;x1,x2,…,xn)=∏i=1np(xi;θ)L(\theta)=L(\theta;x_1,x_2,\dots,x_n)=\displaystyle\prod_{i=1}^n{p(x_i;\theta)}L(θ)=L(θ;x1,x2,…,xn)=i=1∏np(xi;θ)
- 当 XXX 为连续型总体时,设有密度函数 f(x;θ)f(x;\theta)f(x;θ),θ∈Θ\theta \in \Thetaθ∈Θ 是未知的待估参数,Θ\ThetaΘ 为参数空间,X1,X2,…,XnX_1,X_2,\dots,X_nX1,X2,…,Xn 是来自总体 XXX 的样本,设 x1,x2,…,xnx_1,x_2,\dots,x_nx1,x2,…,xn 是已经得到的样本值,此时似然函数 L(θ)=L(θ;x1,x2,…,xn)=∏i=1nf(xi;θ)L(\theta)=L(\theta;x_1,x_2,\dots,x_n)=\displaystyle\prod_{i=1}^n{f(x_i;\theta)}L(θ)=L(θ;x1,x2,…,xn)=i=1∏nf(xi;θ)
- 极大似然估计寻求参数 θ\thetaθ 的估计值 θ^\hat\thetaθ^,使得 L(θ)L(\theta)L(θ) 取到极大值,即 L(θ^)=maxθ∈ΘL(θ;x1,x2,…,xn)L(\hat\theta)=\displaystyle\max_{\theta \in \Theta}{L(\theta;x_1,x_2,\dots,x_n)}L(θ^)=θ∈ΘmaxL(θ;x1,x2,…,xn),此时
- θ^=θ^(x1,x2,…,xn)\hat\theta=\hat\theta(x_1,x_2,\dots,x_n)θ^=θ^(x1,x2,…,xn) 称为极大似然估计值
- 相应的统计量 θ^(X1,X2,…,Xn)\hat\theta(X_1,X_2,\dots,X_n)θ^(X1,X2,…,Xn) 称为极大似然估计量,简记为 MLE\mathrm{MLE}MLE
- 寻求极大似然估计常常采用微分方法:
- 求解似然方程 ∂L(θ)∂θ∣θ=θ^=0\left.\dfrac{\partial L(\theta)}{\partial \theta}\right|_{\theta=\hat\theta}=0∂θ∂L(θ)∣∣∣∣θ=θ^=0
- 为了计算方便,往往事先进行取对数操作,记 l(θ)=lnL(θ)l(\theta)=\ln L(\theta)l(θ)=lnL(θ) 为对数似然函数
- 此时求解对数似然方程 ∂l(θ)∂θ∣θ=θ^=∂lnL(θ)∂θ∣θ=θ^=0\left.\dfrac{\partial l(\theta)}{\partial \theta}\right|_{\theta=\hat\theta}=\left.\dfrac{\partial\ln L(\theta)}{\partial \theta}\right|_{\theta=\hat\theta}=0∂θ∂l(θ)∣∣∣∣θ=θ^=∂θ∂lnL(θ)∣∣∣∣θ=θ^=0
- 极大似然估计的不变性:设参数 θ\thetaθ 的极大似然估计为 θ^\hat\thetaθ^,θ∗=g(θ)\theta^*=g(\theta)θ∗=g(θ) 是 θ\thetaθ 的连续函数,则参数 θ∗\theta^*θ∗ 的极大似然估计为 θ^∗=g(θ^)\hat\theta^*=g(\hat\theta)θ^∗=g(θ^)
无偏性准则
- 设 θ∈Θ\theta \in \Thetaθ∈Θ 是总体 XXX 的待估参数,X1,X2,…,XnX_1,X_2,\dots,X_nX1,X2,…,Xn 是来自总体 XXX 的样本,若估计量 θ^(X1,X2,…,Xn)\hat\theta(X_1,X_2,\dots,X_n)θ^(X1,X2,…,Xn) 的期望存在,且满足 E(θ^)=θ,∀θ∈ΘE(\hat\theta)=\theta, \forall \theta \in \ThetaE(θ^)=θ,∀θ∈Θ,则称 θ^\hat\thetaθ^ 是 θ\thetaθ 的无偏估计
- 若 E(θ^)≠θE(\hat\theta) \ne \thetaE(θ^)=θ,则称 E(θ^)−θE(\hat\theta)-\thetaE(θ^)−θ 为估计量 θ^\hat\thetaθ^ 的偏差
- 若 E(θ^)≠θE(\hat\theta) \ne \thetaE(θ^)=θ,但 limn→+∞E(θ^)=θ\displaystyle\lim_{n \to +\infty}{E(\hat\theta)}=\thetan→+∞limE(θ^)=θ,则称 θ^\hat\thetaθ^ 是 θ\thetaθ 的渐进无偏估计
有效性准则
- 设 θ^1=θ^1(X1,X2,…,Xn)\hat\theta_1=\hat\theta_1(X_1,X_2,\dots,X_n)θ^1=θ^1(X1,X2,…,Xn) 与 θ^2=θ^2(X1,X2,…,Xn)\hat\theta_2=\hat\theta_2(X_1,X_2,\dots,X_n)θ^2=θ^2(X1,X2,…,Xn) 都是参数 θ\thetaθ 的无偏估计,若 ∀θ∈Θ\forall \theta \in \Theta∀θ∈Θ,有 Varθ(θ^1)≤Varθ(θ^2)\mathrm{Var}_\theta(\hat\theta_1) \leq \mathrm{Var}_\theta(\hat\theta_2)Varθ(θ^1)≤Varθ(θ^2),且至少有一个 θ\thetaθ 使不等号成立,则称 θ^1\hat\theta_1θ^1 比 θ^2\hat\theta_2θ^2 有效
均方误差准则
- 设 θ^=θ^(X1,X2,…,Xn)\hat\theta=\hat\theta(X_1,X_2,\dots,X_n)θ^=θ^(X1,X2,…,Xn) 是参数 θ\thetaθ 的一般估计量,称 E[(θ^−θ)2]E[(\hat\theta-\theta)^2]E[(θ^−θ)2] 是估计量 θ^\hat\thetaθ^ 的均方误差,记作 Mse(θ^)=Var(θ^)+(E(θ^)−θ)2\mathrm{Mse}(\hat\theta)=\mathrm{Var}(\hat\theta)+(E(\hat\theta)-\theta)^2Mse(θ^)=Var(θ^)+(E(θ^)−θ)2
- 设 θ^1\hat\theta_1θ^1 与 θ^2\hat\theta_2θ^2 都是参数 θ\thetaθ 的估计量,若 ∀θ∈Θ\forall \theta \in \Theta∀θ∈Θ,有 Mse(θ^1)≤Mse(θ^2)\mathrm{Mse}(\hat\theta_1) \leq \mathrm{Mse}(\hat\theta_2)Mse(θ^1)≤Mse(θ^2),且至少有一个 θ\thetaθ 使不等号成立,则称 θ^1\hat\theta_1θ^1 优于 θ^2\hat\theta_2θ^2
- 若 θ^\hat\thetaθ^ 是参数 θ\thetaθ 的无偏估计,即 E(θ^)=θE(\hat\theta)=\thetaE(θ^)=θ,则 Mse(θ^)=Var(θ^)\mathrm{Mse}(\hat\theta)=\mathrm{Var}(\hat\theta)Mse(θ^)=Var(θ^)
- 当用于无偏估计之间的比较时,均方误差准则等价于有效性准则
相合性准则
- 设 θ^n=θ^(X1,X2,…,Xn)\hat\theta_n=\hat\theta(X_1,X_2,\dots,X_n)θ^n=θ^(X1,X2,…,Xn) 是参数 θ\thetaθ 的一般估计量,若对于任意 ε>0\varepsilon>0ε>0,有 limn→+∞P{∣θ^n−θ∣<ε}=1\displaystyle\lim_{n \to +\infty}{P\{|\hat\theta_n-\theta|<\varepsilon\}}=1n→+∞limP{∣θ^n−θ∣<ε}=1,即 θ^n\hat\theta_nθ^n 依概率收敛于 θ\thetaθ,则称 θ^n\hat\theta_nθ^n 是 θ\thetaθ 的相合估计量,记作 θ^n→Pθ\hat\theta_n \xrightarrow{P} \thetaθ^nPθ
- 一般地,矩估计得到的参数估计都满足相合性,极大似然估计在总体分布满足一定条件下求得的参数估计才是相合估计量
单个正态总体的参数区间估计
- 均值 μ\muμ 的置信区间(σ2\sigma^2σ2 已知):
- 常用 μ\muμ 的点估计为样本均值 X‾\overline{X}X,有 X‾∼N(μ,σ2n)\overline{X} \sim N\left(\mu,\dfrac{\sigma^2}{n}\right)X∼N(μ,nσ2),即 X‾−μσ/n∼N(0,1)\dfrac{\overline{X}-\mu}{\sigma/\sqrt{n}} \sim N(0,1)σ/nX−μ∼N(0,1)
- 取枢轴量 G(X1,X2,…,Xn;μ)=X‾−μσ/nG(X_1,X_2,\dots,X_n;\mu)=\dfrac{\overline{X}-\mu}{\sigma/\sqrt{n}}G(X1,X2,…,Xn;μ)=σ/nX−μ
- 设常数 a<ba<ba<b,且满足 P{a<X‾−μσ/n<b}=P{X‾−bσn<μ<X‾−aσn}=1−αP\left\{a<\dfrac{\overline{X}-\mu}{\sigma/\sqrt{n}}<b\right\}=P\left\{\overline{X}-b\dfrac{\sigma}{\sqrt{n}}<\mu<\overline{X}-a\dfrac{\sigma}{\sqrt{n}}\right\}=1-\alphaP{a<σ/nX−μ<b}=P{X−bnσ<μ<X−anσ}=1−α
- 区间平均长度 L=(b−a)σnL=(b-a)\dfrac{\sigma}{\sqrt{n}}L=(b−a)nσ,根据正态分布对称性,令 a=−b=−zα/2a=-b=-z_{\alpha/2}a=−b=−zα/2 使区间平均长度最短
- 此时置信区间为 (X‾−σnzα/2,X‾+σnzα/2)\left(\overline{X}-\dfrac{\sigma}{\sqrt{n}}z_{\alpha/2}, \overline{X}+\dfrac{\sigma}{\sqrt{n}}z_{\alpha/2}\right)(X−nσzα/2,X+nσzα/2),简记为 (X‾±σnzα/2)\left(\overline{X} \pm \dfrac{\sigma}{\sqrt{n}}z_{\alpha/2}\right)(X±nσzα/2)
- 均值 μ\muμ 的置信区间(σ2\sigma^2σ2 未知):
- 考虑 σ2\sigma^2σ2 的无偏估计 S2S^2S2,有 X‾−μS/n∼t(n−1)\dfrac{\overline{X}-\mu}{S/\sqrt{n}} \sim t(n-1)S/nX−μ∼t(n−1)
- 取枢轴量 G(X1,X2,…,Xn;μ)=X‾−μS/nG(X_1,X_2,\dots,X_n;\mu)=\dfrac{\overline{X}-\mu}{S/\sqrt{n}}G(X1,X2,…,Xn;μ)=S/nX−μ
- 有 P{∣X‾−μS/n∣<tα/2(n−1)}=P{X‾−Sntα/2(n−1)<μ<X‾+Sntα/2(n−1)}=1−αP\left\{\left|\dfrac{\overline{X}-\mu}{S/\sqrt{n}}\right|<t_{\alpha/2}(n-1)\right\}=P\left\{\overline{X}-\dfrac{S}{\sqrt{n}}t_{\alpha/2}(n-1)<\mu<\overline{X}+\dfrac{S}{\sqrt{n}}t_{\alpha/2}(n-1)\right\}=1-\alphaP{∣∣∣∣S/nX−μ∣∣∣∣<tα/2(n−1)}=P{X−nStα/2(n−1)<μ<X+nStα/2(n−1)}=1−α
- 根据 ttt 分布对称性,置信区间取 (X‾±Sntα/2(n−1))\left(\overline{X} \pm \dfrac{S}{\sqrt{n}}t_{\alpha/2}(n-1)\right)(X±nStα/2(n−1))
- 成对数据情形(不相互独立),均值差 μ1−μ2\mu_1-\mu_2μ1−μ2 的置信区间:
- 令 Di=Xi−YiD_i=X_i-Y_iDi=Xi−Yi,则 D‾=X‾−Y‾,SD2=1n−1∑i=1n(Di−D‾)2\overline{D}=\overline{X}-\overline{Y}, S_D^2=\dfrac{1}{n-1}\displaystyle\sum_{i=1}^n{(D_i-\overline{D})^2}D=X−Y,SD2=n−11i=1∑n(Di−D)2
- μD\mu_DμD 的置信区间取 (D‾±SDntα/2(n−1))\left(\overline{D} \pm \dfrac{S_D}{\sqrt{n}}t_{\alpha/2}(n-1)\right)(D±nSDtα/2(n−1))
- 方差 σ2\sigma^2σ2 的置信区间:
- 考虑 (n−1)S2σ2∼χ2(n−1)\dfrac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)σ2(n−1)S2∼χ2(n−1)
- 取枢轴量 G(X1,X2,…,Xn;σ2)=(n−1)S2σ2G(X_1,X_2,\dots,X_n;\sigma^2)=\dfrac{(n-1)S^2}{\sigma^2}G(X1,X2,…,Xn;σ2)=σ2(n−1)S2
- 有 P{χ1−α/22(n−1)<(n−1)S2σ2<χα/22(n−1)}=P{(n−1)S2χα/22(n−1)<σ2<(n−1)S2χ1−α/22(n−1)}=1−αP\left\{\chi_{1-\alpha/2}^2(n-1)<\dfrac{(n-1)S^2}{\sigma^2}<\chi_{\alpha/2}^2(n-1)\right\}=P\left\{\dfrac{(n-1)S^2}{\chi_{\alpha/2}^2(n-1)}<\sigma^2<\dfrac{(n-1)S^2}{\chi_{1-\alpha/2}^2(n-1)}\right\}=1-\alphaP{χ1−α/22(n−1)<σ2(n−1)S2<χα/22(n−1)}=P{χα/22(n−1)(n−1)S2<σ2<χ1−α/22(n−1)(n−1)S2}=1−α
- σ2\sigma^2σ2 的置信区间取 ((n−1)S2χα/22(n−1),(n−1)S2χ1−α/22(n−1))\left(\dfrac{(n-1)S^2}{\chi_{\alpha/2}^2(n-1)}, \dfrac{(n-1)S^2}{\chi_{1-\alpha/2}^2(n-1)}\right)(χα/22(n−1)(n−1)S2,χ1−α/22(n−1)(n−1)S2)
- 由于 χ2\chi^2χ2 分布的密度函数不对称,故上述置信区间不满足区间平均长度最短,但这样的解给实际应用带来方便
两个正态总体的参数区间估计
- 均值差 μ1−μ2\mu_1-\mu_2μ1−μ2 的置信区间(σ2\sigma^2σ2 和 σ22\sigma_2^2σ22 已知):
- 利用 μ1−μ2\mu_1-\mu_2μ1−μ2 的无偏估计 X‾−Y‾\overline{X}-\overline{Y}X−Y,有 X‾−Y‾∼N(μ1−μ2,σ12n+σ22n)\overline{X}-\overline{Y} \sim N\left(\mu_1-\mu_2, \dfrac{\sigma_1^2}{n}+\dfrac{\sigma_2^2}{n}\right)X−Y∼N(μ1−μ2,nσ12+nσ22)
- μ1−μ2\mu_1-\mu_2μ1−μ2 的置信区间取 ((X‾−Y‾)±zα/2σ12n+σ22n)\left((\overline{X}-\overline{Y}) \pm z_{\alpha/2}\sqrt{\dfrac{\sigma_1^2}{n}+\dfrac{\sigma_2^2}{n}}\right)((X−Y)±zα/2nσ12+nσ22)
- 均值差 μ1−μ2\mu_1-\mu_2μ1−μ2 的置信区间(σ2=σ22=σ2\sigma^2=\sigma_2^2=\sigma^2σ2=σ22=σ2,但未知):
- 利用 Sw2=(n1−1)S12+(n2−1)S22n1+n2−2S_w^2=\dfrac{(n_1-1)S_1^2+(n_2-1)S_2^2}{n_1+n_2-2}Sw2=n1+n2−2(n1−1)S12+(n2−1)S22,有 (X‾−Y‾)−(μ1−μ2)Sw1n1+1n2∼t(n1+n2−2)\dfrac{(\overline{X}-\overline{Y})-(\mu_1-\mu_2)}{S_w\sqrt{\dfrac{1}{n_1}+\dfrac{1}{n_2}}} \sim t(n_1+n_2-2)Swn11+n21(X−Y)−(μ1−μ2)∼t(n1+n2−2)
- μ1−μ2\mu_1-\mu_2μ1−μ2 的置信区间取 ((X‾−Y‾)±tα/2(n1+n2−2)Sw1n1+1n2)\left((\overline{X}-\overline{Y}) \pm t_{\alpha/2}(n_1+n_2-2)S_w\sqrt{\dfrac{1}{n_1}+\dfrac{1}{n_2}}\right)((X−Y)±tα/2(n1+n2−2)Swn11+n21)
- 方差比 σ12σ22\dfrac{\sigma_1^2}{\sigma_2^2}σ22σ12 的置信区间:
- 利用 σ12σ22\dfrac{\sigma_1^2}{\sigma_2^2}σ22σ12 的点估计 S12S22\dfrac{S_1^2}{S_2^2}S22S12,有 S12S22/σ12σ22=S12/σ12S22/σ22∼F(n1−1,n2−1)\left.\dfrac{S_1^2}{S_2^2} \middle/ \dfrac{\sigma_1^2}{\sigma_2^2}\right.=\dfrac{S_1^2/\sigma_1^2}{S_2^2/\sigma_2^2} \sim F(n_1-1,n_2-1)S22S12/σ22σ12=S22/σ22S12/σ12∼F(n1−1,n2−1)
- σ12σ22\dfrac{\sigma_1^2}{\sigma_2^2}σ22σ12 的置信区间取 (S12/S22Fα/2(n1+n2−2),S12/S22F1−α/2(n1+n2−2))\left(\dfrac{S_1^2/S_2^2}{F_{\alpha/2}(n_1+n_2-2)}, \dfrac{S_1^2/S_2^2}{F_{1-\alpha/2}(n_1+n_2-2)}\right)(Fα/2(n1+n2−2)S12/S22,F1−α/2(n1+n2−2)S12/S22)
假设检验
单个正态总体参数的假设检验
- 均值 μ\muμ 的假设检验(σ2\sigma^2σ2 已知),称为 ZZZ 检验:
- 考虑双侧假设 H0:μ=μ0,H1:μ≠μ0H_0:\mu=\mu_0,H_1:\mu \ne \mu_0H0:μ=μ0,H1:μ=μ0,取检验统计量为 Z=X‾−μ0σ/nZ=\dfrac{\overline{X}-\mu_0}{\sigma/\sqrt{n}}Z=σ/nX−μ0,拒绝域 W={∣Z∣=∣X‾−μ0σ/n∣≥zα/2}W=\left\{|Z|=\left|\dfrac{\overline{X}-\mu_0}{\sigma/\sqrt{n}}\right| \ge z_{\alpha/2}\right\}W={∣Z∣=∣∣∣∣σ/nX−μ0∣∣∣∣≥zα/2}
- 对给定样本值 x1,x2,…,xnx_1,x_2,\dots,x_nx1,x2,…,xn,检验统计量 ZZZ 的取值 z0=x‾−μ0σ/nz_0=\dfrac{\overline{x}-\mu_0}{\sigma/\sqrt{n}}z0=σ/nx−μ0,当 ∣z0∣≥zα/2|z_0| \ge z_{\alpha/2}∣z0∣≥zα/2 时,拒绝原假设
- P−=PH0{∣Z∣≥∣z0∣}=2PH0{Z≥∣z0∣}=2−2Φ(∣z0∣)P_-=P_{H_0}\{|Z| \ge |z_0|\}=2P_{H_0}\{Z \ge |z_0|\}=2-2\Phi(|z_0|)P−=PH0{∣Z∣≥∣z0∣}=2PH0{Z≥∣z0∣}=2−2Φ(∣z0∣),当 P−P_-P− 值小于等于显著水平 α\alphaα 时拒绝原假设
- 考虑左侧假设 H0:μ≥μ0,H1:μ<μ0H_0:\mu \ge \mu_0,H_1:\mu<\mu_0H0:μ≥μ0,H1:μ<μ0,取检验统计量为 Z=X‾−μ0σ/nZ=\dfrac{\overline{X}-\mu_0}{\sigma/\sqrt{n}}Z=σ/nX−μ0,拒绝域 W={Z=X‾−μ0σ/n≤c}W=\left\{Z=\dfrac{\overline{X}-\mu_0}{\sigma/\sqrt{n}} \leq c\right\}W={Z=σ/nX−μ0≤c}
- 犯第 I 类错误的概率 α(μ,c)=P{X‾−μ0σ/n≤c|μ≥μ0}\alpha(\mu,c)=P\left\{\dfrac{\overline{X}-\mu_0}{\sigma/\sqrt{n}} \leq c \middle| \mu \ge \mu_0\right\}α(μ,c)=P{σ/nX−μ0≤c∣∣∣∣μ≥μ0},由于 ZZZ 不服从标准正态分布,而是 Z∼N(μ−μ0σ/n,1)Z \sim N\left(\dfrac{\mu-\mu_0}{\sigma/\sqrt{n}}, 1\right)Z∼N(σ/nμ−μ0,1),因此 α(μ,c)=Φ(c−μ−μ0σ/n1)=Φ(c−μ−μ0σ/n),μ≥μ0\alpha(\mu,c)=\Phi\left(\dfrac{c-\dfrac{\mu-\mu_0}{\sigma/\sqrt{n}}}{1}\right)=\Phi\left(c-\dfrac{\mu-\mu_0}{\sigma/\sqrt{n}}\right), \mu \ge \mu_0α(μ,c)=Φ⎝⎜⎜⎛1c−σ/nμ−μ0⎠⎟⎟⎞=Φ(c−σ/nμ−μ0),μ≥μ0
- 当取 c=z1−α/2=−zαc=z_{1-\alpha/2}=-z_\alphac=z1−α/2=−zα 时,犯第 II 类错误的概率最小,此时拒绝域 W={Z=X‾−μ0σ/n≤−zα}W=\left\{Z=\dfrac{\overline{X}-\mu_0}{\sigma/\sqrt{n}} \leq -z_\alpha\right\}W={Z=σ/nX−μ0≤−zα}
- P−=supμ≥μ0P{Z≤z0}=P{Z≤z0∣μ=μ0}=Φ(z0)P_-=\displaystyle\sup_{\mu \ge \mu_0}{P\{Z \leq z_0\}}=P\{Z \leq z_0 | \mu=\mu_0\}=\Phi(z_0)P−=μ≥μ0supP{Z≤z0}=P{Z≤z0∣μ=μ0}=Φ(z0),当 P−P_-P− 值小于等于显著水平 α\alphaα 时拒绝原假设
- 考虑右侧假设 H0:μ≤μ0,H1:μ>μ0H_0:\mu \leq \mu_0,H_1:\mu>\mu_0H0:μ≤μ0,H1:μ>μ0,取检验统计量为 Z=X‾−μ0σ/nZ=\dfrac{\overline{X}-\mu_0}{\sigma/\sqrt{n}}Z=σ/nX−μ0,类似得到拒绝域 W={Z=X‾−μ0σ/n≥zα}W=\left\{Z=\dfrac{\overline{X}-\mu_0}{\sigma/\sqrt{n}} \ge z_\alpha\right\}W={Z=σ/nX−μ0≥zα}
- P−=supμ≤μ0P{Z≥z0}=P{Z≥z0∣μ=μ0}=1−Φ(z0)P_-=\displaystyle\sup_{\mu \leq \mu_0}{P\{Z \ge z_0\}}=P\{Z \ge z_0 | \mu=\mu_0\}=1-\Phi(z_0)P−=μ≤μ0supP{Z≥z0}=P{Z≥z0∣μ=μ0}=1−Φ(z0),当 P−P_-P− 值小于等于显著水平 α\alphaα 时拒绝原假设
- 考虑双侧假设 H0:μ=μ0,H1:μ≠μ0H_0:\mu=\mu_0,H_1:\mu \ne \mu_0H0:μ=μ0,H1:μ=μ0,取检验统计量为 Z=X‾−μ0σ/nZ=\dfrac{\overline{X}-\mu_0}{\sigma/\sqrt{n}}Z=σ/nX−μ0,拒绝域 W={∣Z∣=∣X‾−μ0σ/n∣≥zα/2}W=\left\{|Z|=\left|\dfrac{\overline{X}-\mu_0}{\sigma/\sqrt{n}}\right| \ge z_{\alpha/2}\right\}W={∣Z∣=∣∣∣∣σ/nX−μ0∣∣∣∣≥zα/2}
- 均值 μ\muμ 的假设检验(σ2\sigma^2σ2 未知),称为 ttt 检验:
- 利用样本方差 S2S^2S2 代替总体方差 σ2\sigma^2σ2,取检验统计量 T=X‾−μ0S/n∼t(n−1)T=\dfrac{\overline{X}-\mu_0}{S/\sqrt{n}} \sim t(n-1)T=S/nX−μ0∼t(n−1),对给定样本值 x1,x2,…,xnx_1,x_2,\dots,x_nx1,x2,…,xn,检验统计量 TTT 的取值 t0=x‾−μ0σ/nt_0=\dfrac{\overline{x}-\mu_0}{\sigma/\sqrt{n}}t0=σ/nx−μ0
- 考虑双侧假设 H0:μ=μ0,H1:μ≠μ0H_0:\mu=\mu_0,H_1:\mu \ne \mu_0H0:μ=μ0,H1:μ=μ0,拒绝域 W={∣T∣=∣X‾−μ0S/n∣≥tα/2(n−1)}W=\left\{|T|=\left|\dfrac{\overline{X}-\mu_0}{S/\sqrt{n}}\right| \ge t_{\alpha/2}(n-1)\right\}W={∣T∣=∣∣∣∣S/nX−μ0∣∣∣∣≥tα/2(n−1)},P−=2PH0{t(n−1)≥∣t0∣}P_-=2P_{H_0}\{t(n-1) \ge |t_0|\}P−=2PH0{t(n−1)≥∣t0∣}
- 考虑左侧假设 H0:μ≥μ0,H1:μ<μ0H_0:\mu \ge \mu_0,H_1:\mu<\mu_0H0:μ≥μ0,H1:μ<μ0,拒绝域 W={T=X‾−μ0S/n≤−tα(n−1)}W=\left\{T=\dfrac{\overline{X}-\mu_0}{S/\sqrt{n}} \leq -t_{\alpha}(n-1)\right\}W={T=S/nX−μ0≤−tα(n−1)},P−=supμ≥μ0P{T≤t0}=P{t(n−1)≤t0}P_-=\displaystyle\sup_{\mu \ge \mu_0}{P\{T \leq t_0\}}=P\{t(n-1) \leq t_0\}P−=μ≥μ0supP{T≤t0}=P{t(n−1)≤t0}
- 考虑右侧假设 H0:μ≤μ0,H1:μ>μ0H_0:\mu \leq \mu_0,H_1:\mu>\mu_0H0:μ≤μ0,H1:μ>μ0,拒绝域 W={T=X‾−μ0S/n≥tα(n−1)}W=\left\{T=\dfrac{\overline{X}-\mu_0}{S/\sqrt{n}} \ge t_{\alpha}(n-1)\right\}W={T=S/nX−μ0≥tα(n−1)},P−=supμ≤μ0P{T≥t0}=P{t(n−1)≥t0}P_-=\displaystyle\sup_{\mu \leq \mu_0}{P\{T \ge t_0\}}=P\{t(n-1) \ge t_0\}P−=μ≤μ0supP{T≥t0}=P{t(n−1)≥t0}
- 方差 σ2\sigma^2σ2 的假设检验,称为 χ2\chi^2χ2 检验:
- 利用 σ2\sigma^2σ2 的无偏估计 S2=1n−1∑i=1n(Xi−X‾)2S^2=\dfrac{1}{n-1}\displaystyle\sum_{i=1}^n{(X_i-\overline{X})^2}S2=n−11i=1∑n(Xi−X)2,有 (n−1)S2σ2∼χ2(n−1)\dfrac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)σ2(n−1)S2∼χ2(n−1),取检验统计量 χ2=(n−1)S2σ02\chi^2=\dfrac{(n-1)S^2}{\sigma_0^2}χ2=σ02(n−1)S2,代入样本值后的检验统计量 χ02=(n−1)s2σ02\chi_0^2=\dfrac{(n-1)s^2}{\sigma_0^2}χ02=σ02(n−1)s2,记 p0=PH0{χ2(n−1)≤χ02}p_0=P_{H_0}\{\chi^2(n-1) \leq \chi_0^2\}p0=PH0{χ2(n−1)≤χ02}
- 考虑双侧假设 H0:σ2=σ02,H1:σ2≠σ02H_0:\sigma^2=\sigma_0^2,H_1:\sigma^2 \ne \sigma_0^2H0:σ2=σ02,H1:σ2=σ02,拒绝域 W={χ2≥χα/22(n−1)}∪{χ2≤χ1−α/22(n−1)}W=\{\chi^2 \ge \chi_{\alpha/2}^2(n-1)\} \cup \{\chi^2 \leq \chi_{1-\alpha/2}^2(n-1)\}W={χ2≥χα/22(n−1)}∪{χ2≤χ1−α/22(n−1)},P−=2min(p0,1−p0)P_-=2\displaystyle\min(p_0,1-p_0)P−=2min(p0,1−p0)
- 考虑左侧假设 H0:σ2≥σ02,H1:σ2<σ02H_0:\sigma^2 \ge \sigma_0^2,H_1:\sigma^2<\sigma_0^2H0:σ2≥σ02,H1:σ2<σ02,拒绝域 W={χ2≤χ1−α2(n−1)}W=\{\chi^2 \leq \chi_{1-\alpha}^2(n-1)\}W={χ2≤χ1−α2(n−1)},P−=p0P_-=p_0P−=p0
- 考虑右侧假设 H0:σ2≤σ02,H1:σ2>σ02H_0:\sigma^2 \leq \sigma_0^2,H_1:\sigma^2>\sigma_0^2H0:σ2≤σ02,H1:σ2>σ02,拒绝域 W={χ2≥χα2(n−1)}W=\{\chi^2 \ge \chi_{\alpha}^2(n-1)\}W={χ2≥χα2(n−1)},P−=1−p0P_-=1-p_0P−=1−p0
两个正态总体参数的假设检验
- 均值差 μ1−μ2\mu_1-\mu_2μ1−μ2 的假设检验(σ12\sigma_1^2σ12 和 σ22\sigma_2^2σ22 已知):
- 检验统计量 X‾−Y‾∼N(μ1−μ2,σ12n1+σ22n2)\overline{X}-\overline{Y} \sim N\left(\mu_1-\mu_2, \dfrac{\sigma_1^2}{n_1}+\dfrac{\sigma_2^2}{n_2}\right)X−Y∼N(μ1−μ2,n1σ12+n2σ22)
- 考虑双侧假设 H0:μ1=μ2,H1:μ1≠μ2H_0:\mu_1=\mu_2, H_1:\mu_1 \ne \mu_2H0:μ1=μ2,H1:μ1=μ2,当 H0H_0H0 成立时 X‾−Y‾∼N(0,σ12n1+σ22n2)\overline{X}-\overline{Y} \sim N\left(0, \dfrac{\sigma_1^2}{n_1}+\dfrac{\sigma_2^2}{n_2}\right)X−Y∼N(0,n1σ12+n2σ22),利用 ZZZ 检验,得到拒绝域 W={∣X‾−Y‾∣σ12n1+σ22n2≥zα/2}W=\left\{\dfrac{|\overline{X}-\overline{Y}|}{\sqrt{\dfrac{\sigma_1^2}{n_1}+\dfrac{\sigma_2^2}{n_2}}} \ge z_{\alpha/2}\right\}W=⎩⎪⎪⎪⎪⎨⎪⎪⎪⎪⎧n1σ12+n2σ22∣X−Y∣≥zα/2⎭⎪⎪⎪⎪⎬⎪⎪⎪⎪⎫,P−=PH0{∣Z∣≥∣z0∣}=2PH0{Z≥∣z0∣}=2−2Φ(∣z0∣)P_-=P_{H_0}\{|Z| \ge |z_0|\}=2P_{H_0}\{Z \ge |z_0|\}=2-2\Phi(|z_0|)P−=PH0{∣Z∣≥∣z0∣}=2PH0{Z≥∣z0∣}=2−2Φ(∣z0∣)
- 均值差 μ1−μ2\mu_1-\mu_2μ1−μ2 的假设检验(σ12=σ22=σ2\sigma_1^2=\sigma_2^2=\sigma^2σ12=σ22=σ2 但未知),称为两样本精确 ttt 检验:
- 采用 σ2\sigma^2σ2 的无偏估计 Sw2=(n1−1)S12+(n2−1)S22n1+n2−2S_w^2=\dfrac{(n_1-1)S_1^2+(n_2-1)S_2^2}{n_1+n_2-2}Sw2=n1+n2−2(n1−1)S12+(n2−1)S22
- 考虑双侧假设 H0:μ1=μ2,H1:μ1≠μ2H_0:\mu_1=\mu_2, H_1:\mu_1 \ne \mu_2H0:μ1=μ2,H1:μ1=μ2,取检验统计量 T=X‾−Y‾Sw1n1+1n2T=\dfrac{\overline{X}-\overline{Y}}{S_w\sqrt{\dfrac{1}{n_1}+\dfrac{1}{n_2}}}T=Swn11+n21X−Y,当 H0H_0H0 成立时 T∼t(n1+n2−2)T \sim t(n_1+n_2-2)T∼t(n1+n2−2),得到拒绝域 W={∣T∣≥tα/2(n1+n2−2)}W=\{|T| \ge t_{\alpha/2}(n_1+n_2-2)\}W={∣T∣≥tα/2(n1+n2−2)},P−=PH0{∣T∣≥∣t0∣}=2PH0{t(n1+n2−2)≥∣t0∣}P_-=P_{H_0}\{|T| \ge |t_0|\}=2P_{H_0}\{t(n_1+n_2-2) \ge |t_0|\}P−=PH0{∣T∣≥∣t0∣}=2PH0{t(n1+n2−2)≥∣t0∣}
- 方差比 σ12σ22\dfrac{\sigma_1^2}{\sigma_2^2}σ22σ12 的假设检验:
- 取检验统计量 F=S12S22F=\dfrac{S_1^2}{S_2^2}F=S22S12,记代入样本值后的检验统计量 f0=s12s22f_0=\dfrac{s_1^2}{s_2^2}f0=s22s12,设 p0=PH0{F≤f0}=P{F(n1−1,n2−1)≤f0}p_0=P_{H_0}\{F \leq f_0\}=P\{F(n_1-1,n_2-1) \leq f_0\}p0=PH0{F≤f0}=P{F(n1−1,n2−1)≤f0}
- 考虑双侧假设 H0:σ12=σ22,H1:σ12≠σ22H_0:\sigma_1^2=\sigma_2^2, H_1:\sigma_1^2 \ne \sigma_2^2H0:σ12=σ22,H1:σ12=σ22,当 H0H_0H0 成立时 F∼F(n1−1,n2−1)F \sim F(n_1-1,n_2-1)F∼F(n1−1,n2−1),得到拒绝域 W={F≥Fα/2(n1−1,n2−1)}∪{F≤F1−α/2(n1−1,n2−1)}W=\{F \ge F_{\alpha/2}(n_1-1,n_2-1)\} \cup \{F \leq F_{1-\alpha/2}(n_1-1,n_2-1)\}W={F≥Fα/2(n1−1,n2−1)}∪{F≤F1−α/2(n1−1,n2−1)},P−=2min(p0,1−p0)P_-=2\displaystyle\min(p_0, 1-p_0)P−=2min(p0,1−p0)
- 考虑左侧假设 H0:σ12≥σ22,H1:σ12<σ22H_0:\sigma_1^2 \ge \sigma_2^2, H_1:\sigma_1^2<\sigma_2^2H0:σ12≥σ22,H1:σ12<σ22,P−=p0P_-=p_0P−=p0
- 考虑右侧侧假设 H0:σ12≤σ22,H1:σ12>σ22H_0:\sigma_1^2 \leq \sigma_2^2, H_1:\sigma_1^2>\sigma_2^2H0:σ12≤σ22,H1:σ12>σ22,P−=1−p0P_-=1-p_0P−=1−p0
3万+

被折叠的 条评论
为什么被折叠?



