概率论与数理统计复习

最新推荐文章于 2025-11-25 14:11:30 发布

原创最新推荐文章于 2025-11-25 14:11:30 发布 · 987 阅读

2 ·

CC 4.0 BY-SA版权

文章标签：

#概率论 #线性代数 #矩阵

概率论的基本概念

事件频率

对任一事件 $A$ ： $\leq f_n(A) \leq 1$
$f_n(S)=1$
当事件 $A$ 和事件 $B$ 不相容时， $fn(A∪B)=fn(A)+fn(B)f_n(A \cup B)=f_n(A)+f_n(B)$
推广： $fn(⋃j=1kAj)=∑j=1kfn(Aj)f_n\left(\displaystyle\bigcup_{j=1}^k{A_j}\right)=\displaystyle\sum_{j=1}^k{f_n(A_j)}$

概率公理

非负性： $\ge 0$
规范性： $P (S) = 1$
可列可加性：对 $S$ 中的可列个两两不相容事件 $A1,A2,…,An,…A_1,A_2,\dots,A_n,\dots$ ，有 $P(⋃j=1+∞Aj)=∑j=1+∞P(Aj)P\left(\displaystyle\bigcup_{j=1}^{+\infty}{A_j}\right)=\displaystyle\sum_{j=1}^{+\infty}{P(A_j)}$

概率性质

对于有限个两两不相容的事件的和事件，有 $P(⋃j=1nAj)=∑j=1nP(Aj)P\left(\displaystyle\bigcup_{j=1}^n{A_j}\right)=\displaystyle\sum_{j=1}^n{P(A_j)}$
$P(Aˉ)=1−P(A)P(\bar{A})=1-P(A)$
当 $\subset A$ 时， $P (A - B) = P (A) - P (B)$ ，从而 $\ge P(B)$
证明： $\cup A\bar{B} \xRightarrow{\because B \cap A\bar{B}=\varnothing} P(A)=P(B)+P(A\bar{B})=P(B)+P(A-B)$
$∴P(A−B)=P(A)−P(B)⇒∵P(A−B)≥0P(A)≥P(B)\therefore P(A-B)=P(A)-P(B) \xRightarrow{\because P(A-B) \ge 0} P(A) \ge P(B)$
一般情况下： $P (A - B) = P (A) - P (A B)$
概率加法公式： $\cup B)=P(A)+P(B)-P(AB)$
证明： ${A=A∩(B∪Bˉ)=AB∪ABˉ⇒∵AB∩ABˉ=∅P(A)=P(AB)+P(ABˉ)A∪B=B∪ABˉ⇒∵B∩ABˉ=∅P(A∪B)=P(B)+P(ABˉ)\begin{cases}A=A \cap (B \cup \bar{B})=AB \cup A\bar{B} \xRightarrow{\because AB \cap A\bar{B}=\varnothing} P(A)=P(AB)+P(A\bar{B}) \\ A \cup B=B \cup A\bar{B} \xRightarrow{\because B \cap A\bar{B}=\varnothing} P(A \cup B)=P(B)+P(A\bar{B})\end{cases}$
$∴P(A∪B)=P(A)+P(B)−P(AB)\therefore P(A \cup B)=P(A)+P(B)-P(AB)$
推广： $P(⋃j=1nAj)=∑j=1nP(Aj)−∑i<jP(AiAj)+∑i<j<kP(AiAjAk)−⋯+(−1)n−1P(A1A2⋯An)P\left(\displaystyle\bigcup_{j=1}^n{A_j}\right)=\displaystyle\sum_{j=1}^n{P(A_j)}-\displaystyle\sum_{i<j}{P(A_iA_j)}+\displaystyle\sum_{i<j<k}{P(A_iA_jA_k)}- \cdots +(-1)^{n-1}P(A_1A_2 \cdots A_n)$

条件概率

如果 $P (B) > 0$ ，那么在 $B$ 发生的条件下 $A$ 发生的条件概率为 $P(A∣B)=P(AB)P(B)P(A|B)=\dfrac{P(AB)}{P(B)}$
当 $\ne 0$ 时，有：
- $\ge 0$
- $P (S ∣ C) = 1$
- $P(B∣C)=1−P(Bˉ∣C)P(B|C)=1-P(\bar{B}|C)$
- 当 $\supset B$ 时， $\ge P(B|C)$
- $\cup B|C)=P(A|C)+P(B|C)-P(AB|C)$
- 特别地，若 $AB=∅AB=\varnothing$ ，则 $\cup B|C)=P(A|C)+P(B|C)$
乘法公式：当 $\ne 0$ 且 $\ne 0$ 时， $\cdot P(B|A)=P(B) \cdot P(A|B)$
全概率公式：设 $S$ 为某一试验的样本空间， $A$ 为该试验的事件，设 $B1,B2,…,BnB_1,B_2,\dots,B_n$ 是 $S$ 的一个划分，且 $P(B_j)>0$ ，则 $P(A)=∑j=1nP(Bj)P(A∣Bj)P(A)=\displaystyle\sum_{j=1}^n{P(B_j)P(A|B_j)}$
证明： $\cap \left(\displaystyle\bigcup_{j=1}^n{B_j}\right)=\displaystyle\bigcup_{j=1}^n{AB_j} \xRightarrow{\because P(AB_j)=P(B_j) \cdot P(A|B_j)} P(A)\displaystyle\sum_{j=1}^n{P(B_j)P(A|B_j)}$
贝叶斯公式：设 $S$ 为某一试验的样本空间， $A$ 为该试验的事件且 $\ne 0$ ，设 $B1,B2,…,BnB_1,B_2,\dots,B_n$ 是 $S$ 的一个划分，且 $P(B_j)>0$ ，则 $P(Bk∣A)=P(BkA)P(A)=P(Bk)P(A∣Bk)∑j=1nP(Bj)P(A∣Bj)P(B_k|A)=\dfrac{P(B_kA)}{P(A)}=\dfrac{P(B_k)P(A|B_k)}{\displaystyle\sum_{j=1}^n{P(B_j)P(A|B_j)}}$

事件的独立性

设 $A$ 和 $B$ 为两随机事件，当 $\cdot P(B)$ 时称事件 $A$ 和事件 $B$ 相互独立
当 $\cdot P(B) \ne 0$ 时，“事件 $A$ 和事件 $B$ 相互独立”等价于条件概率等于无条件概率，即 $P (B ∣ A) = P (B)$ 或 $P (A ∣ B) = P (A)$
当事件 $A$ 和事件 $B$ 相互独立时， $A$ 和 $Bˉ\bar{B}$ 、 $Aˉ\bar{A}$ 和 $B$ 、 $Aˉ\bar{A}$ 和 $Bˉ\bar{B}$ 均相互独立
设 $A, B, C$ 为三个随机事件，当 ${P(AB)=P(A)P(B)P(BC)=P(B)P(C)P(CA)=P(C)P(A)\begin{cases} P(AB)=P(A)P(B) \\ P(BC)=P(B)P(C) \\ P(CA)=P(C)P(A) \end{cases}$ 都成立时，称事件 $A, B, C$ 两两独立；如果还满足 $P (A B C) = P (A) P (B) P (C)$ ，则称事件 $A, B, C$ 相互独立
若 $n$ 个事件 $A1,A2,…,An(n≥2)A_1,A_2,\dots,A_n (n \ge 2)$ 的任一子排列 $Ai1,Ai2,…,Aik(2≤k≤n)A_{i_1},A_{i_2},\dots,A_{i_k} (2 \leq k \leq n)$ 都满足 $P(Ai1Ai2⋯Aik)=∏j=1kP(Aij)P(A_{i_1}A_{i_2} \cdots A_{i_k})=\displaystyle\prod_{j=1}^k{P(A_{i_j})}$ ，则称事件 $A1,A2,…,AnA_1,A_2,\dots,A_n$ 相互独立

随机变量及其概率分布

二项分布

若随机变量 $X$ 的概率分布律为 $(k∈N)P\{X=k\}=C_n^k(1-p)^{n-k}p^k \ (k \in \mathbb{N})$ ，其中 $0 < p < 1$ 且 $\ge 1$ ，则称 $X$ 服从参数为 $(n, p)$ 的二项分布，记作 $\sim B(n,p)$

泊松分布

若随机变量 $X$ 的概率分布律为 $(k∈N)P\{X=k\}=e^{-\lambda} \cdot \dfrac{\lambda^k}{k!} \ (k \in \mathbb{N})$ ，其中 $λ>0\lambda>0$ ，则称 $X$ 服从参数为 $λ\lambda$ 的泊松分布，记作 $\sim P(\lambda)$
当 $n$ 足够大、 $p$ 足够小时，可以用泊松分布 $P (n p)$ 近似估计二项分布 $B (n, p)$

随机变量的分布函数

$∫−∞xP{X=x}dxF(x)=P\{X \leq x\}=\displaystyle\sum_{x_i \leq x}{P\{X=x_i\}} \ \ \mathrm{or} \ \ \displaystyle\int_{-\infty}^x{P\{X=x\}\mathrm{d}x}$
$P{x1<X≤x2}=P{X≤x2}−P{X≤x1}=F(x2)−F(x1)P\{x_1<X \leq x_2\}=P\{X \leq x_2\}-P\{X \leq x_1\}=F(x_2)-F(x_1)$
分布函数的性质：
- $F (x)$ 单调不减
- $\leq F(x) \leq 1$ ，且满足 $lim⁡a→−∞F(a)=0\displaystyle\lim_{a \to -\infty}{F(a)}=0$ 和 $lim⁡b→+∞F(b)=1\displaystyle\lim_{b \to +\infty}{F(b)}=1$
- $F (x + 0) = F (x)$ ，即 $F (x)$ 右连续

连续型随机变量的密度函数

对于随机变量 $X$ ，其分布函数为 $F (x)$ ，若存在一个非负的实函数 $f (x)$ ，使得对任意实数 $x$ ，有 $F(x)=∫−∞xf(t)dtF(x)=\displaystyle\int_{-\infty}^x{f(t)\mathrm{d}t}$ ，则称 $f (x)$ 为连续型随机变量 $X$ 的密度函数
密度函数的性质：
- $\ge 0$
- $∫−∞+∞f(t)dt=1\displaystyle\int_{-\infty}^{+\infty}{f(t)\mathrm{d}t}=1$
- 对于任意实数 $x_1<x_2$ ，有 $P{x1<X≤x2}=F(x2)−F(x1)=∫x1x2f(t)dtP\{x_1<X \leq x_2\}=F(x_2)-F(x_1)=\displaystyle\int_{x_1}^{x_2}{f(t)\mathrm{d}t}$
- 若 $f (x)$ 在 $x=x_0$ 处连续，则 $F^{'} (x) = f (x)$
由 $F (x)$ 的连续性可以推出 $P\{X=a\}=0$ ，即连续型随机变量取任一定值的概率为零

均匀分布

设随机变量 $X$ 具有密度函数 $f(x)={1b−a,x∈(a,b)0,otherwisef(x)=\begin{cases}\dfrac{1}{b-a}, x \in (a,b) \\ 0, otherwise\end{cases}$ ，则称 $X$ 服从区间 $(a, b)$ 上的均匀分布，记作 $\sim U(a,b)$
均匀分布的分布函数： $F(x)={0,x<ax−ab−a,a≤x<b1,x≥bF(x)=\begin{cases}0, &x<a \\ \dfrac{x-a}{b-a}, &a \leq x<b \\ 1, &x \ge b\end{cases}$

正态分布

设随机变量 $X$ 具有密度函数 $f(x)=12πσexp⁡[−(x−μ)22σ2]f(x)=\dfrac{1}{\sqrt{2\pi}\sigma}\exp\left[-\dfrac{(x-\mu)^2}{2\sigma^2}\right]$ ，其中 $σ>0\sigma>0$ 且 $∣μ∣<+∞|\mu|<+\infty$ ，则称 $X$ 服从参数为 $(μ,σ)(\mu,\sigma)$ 的正态分布，记作 $\sim N(\mu,\sigma^2)$
正态分布密度函数的性质：
- $f (x)$ 关于 $x=μx=\mu$ 对称
- $max⁡∣x∣<+∞f(x)=f(μ)=12πσ\displaystyle\max_{|x|<+\infty}{f(x)}=f(\mu)=\dfrac{1}{\sqrt{2\pi}\sigma}$
- $lim⁡∣x−μ∣→+∞f(x)=0\displaystyle\lim_{|x-\mu| \to +\infty}{f(x)}=0$
标准正态分布 $\sim N(0,1)$ ，密度函数 $φ(x)=12πexp⁡(−x22)\varphi(x)=\dfrac{1}{\sqrt{2\pi}}\exp\left(-\dfrac{x^2}{2}\right)$ ，分布函数 $Φ(x)=12πexp⁡(−x22)\Phi(x)=\dfrac{1}{\sqrt{2\pi}}\exp\left(-\dfrac{x^2}{2}\right)$
- 根据对称性， $Φ(−x)=P{Z≤−x}=P{Z≥x}=1−Φ(x)\Phi(-x)=P\{Z \leq -x\}=P\{Z \ge x\}=1-\Phi(x)$
- 对于一般正态分布 $\sim N(\mu,\sigma^2)$ ， $P{a<X<b}=Φ(b−μσ)−Φ(a−μσ)P\{a<X<b\}=\Phi\left(\dfrac{b-\mu}{\sigma}\right)-\Phi\left(\dfrac{a-\mu}{\sigma}\right)$
- 若 $zαz_\alpha$ 满足 $Φ(zα)=1−α\Phi(z_\alpha)=1-\alpha$ ，称 $zαz_\alpha$ 为标准正态分布的上 $α\alpha$ 分位数

指数分布

设随机变量 $X$ 具有密度函数 $f(x)={λe−λx,x>00,x≤0f(x)=\begin{cases}\lambda e^{-\lambda x}, &x>0 \\ 0, &x \leq 0\end{cases}$ ，其中 $λ>0\lambda>0$ ，则称 $X$ 服从参数为 $λ\lambda$ 的指数分布，记作 $\sim E(\lambda)$
指数分布的分布函数： $F(x)={1−e−λx,x>00,x≤0F(x)=\begin{cases}1-e^{-\lambda x}, &x>0 \\ 0, &x \leq 0\end{cases}$
指数分布具有无记忆性： $P{X>t0+t}=P{X>t0}⋅P{X>t}P\{X>t_0+t\}=P\{X>t_0\} \cdot P\{X>t\}$

随机变量函数的分布

设 $X$ 为一连续型随机变量，其密度函数为 $f_X(x)$ ，随机变量 $Y = g (X)$ 。若函数 $y = g (x)$ 为一严格单调递增（或单调递减）函数，且处处可微，记其反函数为 $x = h (y)$ ，则 $Y$ 的密度函数为 $fY(y)={fX(h(y))⋅∣h′(y)∣,y∈D0,y∉Df_Y(y)=\begin{cases}f_X(h(y)) \cdot |h'(y)|, &y \in D \\ 0, &y \not\in D\end{cases}$ ，其中 $D$ 为函数 $y = g (x)$ 的值域

多元随机变量及其分布

二元离散型随机变量

设二元离散型随机变量 $(X, Y)$ 的可能取值为 $x_i,y_j)$ ，其中 $\in \mathbb{N}^+$ ，称 $P\{X=x_i, Y=y_j\}=p_{ij}$ 为 $(X, Y)$ 的联合分布律
二元离散型随机变量的边际分布：
- $P{X=xi}=P(⋃j=1+∞{X=xi,Y=yj})=∑j=1+∞pij≜pi⋅P\{X=x_i\}=P\left(\displaystyle\bigcup_{j=1}^{+\infty}{\{X=x_i, Y=y_j\}}\right)=\displaystyle\sum_{j=1}^{+\infty}{p_{ij}} \triangleq p_{i \cdot}$
- $P{Y=yj}=P(⋃i=1+∞{X=xi,Y=yj})=∑i=1+∞pij≜p⋅jP\{Y=y_j\}=P\left(\displaystyle\bigcup_{i=1}^{+\infty}{\{X=x_i, Y=y_j\}}\right)=\displaystyle\sum_{i=1}^{+\infty}{p_{ij}} \triangleq p_{\cdot j}$
二元离散型随机变量的条件分布：
- $P{X=xi∣Y=yj}=P{X=xi,Y=yj}P{Y=yj}=pijp⋅jP\{X=x_i|Y=y_j\}=\dfrac{P\{X=x_i, Y=y_j\}}{P\{Y=y_j\}}=\dfrac{p_{ij}}{p_{\cdot j}}$
- $P{Y=yj∣X=xi}=P{X=xi,Y=yj}P{X=xi}=pijpi⋅P\{Y=y_j|X=x_i\}=\dfrac{P\{X=x_i, Y=y_j\}}{P\{X=x_i\}}=\dfrac{p_{ij}}{p_{i \cdot}}$

二元随机变量的分布函数

二元随机变量的联合分布函数：设二元随机变量 $(X, Y)$ ，对于任意实数 $x, y$ ，称函数 $F(x,y)=P{X≤x,Y≤y}F(x,y)=P\{X \leq x, Y \leq y\}$ 为 $(X, Y)$ 的联合分布函数
二元联合分布函数的性质：
- 对于固定的 $x=x_0$ ， $F(x_0, y)$ 关于 $y$ 单调不减
- 对于固定的 $y=y_0$ ， $F(x, y_0)$ 关于 $x$ 单调不减
- $\leq F(x,y) \leq 1$
- $-\infty)=F(-\infty, y)=F(-\infty, -\infty)=0, F(+\infty, +\infty)=1$
- $F (x + 0, y) = F (x, y)$ ，即 $F (x, y)$ 关于 $x$ 右连续
- $F (x, y + 0) = F (x, y)$ ，即 $F (x, y)$ 关于 $y$ 右连续
- 对于实数 $x_1<x_2$ 和 $y_1<y_2$ ， $P{x1<X≤x2,y1<Y≤y2}=F(x2,y2)−F(x1,y2)−F(x2,y1)+F(x1,y1)P\{x_1<X \leq x_2, y_1<Y \leq y_2\}=F(x_2,y_2)-F(x_1,y_2)-F(x_2,y_1)+F(x_1,y_1)$
二元边际分布函数：
- $FX(x)=P{X≤x}=P{X≤x,Y≤+∞}=F(x,+∞)F_X(x)=P\{X \leq x\}=P\{X \leq x, Y \leq +\infty\}=F(x, +\infty)$
- $FY(y)=P{Y≤y}=P{X≤+∞,Y≤y}=F(+∞,y)F_Y(y)=P\{Y \leq y\}=P\{X \leq +\infty, Y \leq y\}=F(+\infty, y)$
二元条件分布函数： $lim⁡δ→0+P{Y≤y∣xi<X≤xi+δ}F_{Y|X}(y|x_i)=P\{Y \leq y|X=x_i\} \ \ \mathrm{or} \ \ \displaystyle\lim_{\delta \to 0^+}{P\{Y \leq y|x_i<X \leq x_i+\delta\}}$

二元连续型随机变量

设二元随机变量 $(X, Y)$ 的联合分布函数为 $F (x, y)$ ，若存在二元函数 $\ge 0$ ，对任意实数 $x, y$ 有 $F(x,y)=∫−∞x∫−∞yf(u,v)dudvF(x,y)=\displaystyle\int_{-\infty}^x\displaystyle\int_{-\infty}^y{f(u,v)\mathrm{d}u\mathrm{d}v}$ ，则称 $f (x, y)$ 为 $(X, Y)$ 的联合密度函数
联合密度函数的性质：
- $\ge 0$
- $∫−∞+∞∫−∞+∞f(u,v)dudv=F(+∞,+∞)=1\displaystyle\int_{-\infty}^{+\infty}\displaystyle\int_{-\infty}^{+\infty}{f(u,v)\mathrm{d}u\mathrm{d}v}=F(+\infty,+\infty)=1$
- 若 $F (x, y)$ 在 $(x, y)$ 处连续，则 $∂2F(x,y)∂x∂y=f(x,y)\dfrac{\partial^2 F(x,y)}{\partial x \partial y}=f(x,y)$
- $(X, Y)$ 落入 $x O y$ 平面任一区域 $D$ 的概率为 $P{(X,Y)∈D}=∬Df(x,y)dxdyP\{(X,Y) \in D\}=\displaystyle\iint_D{f(x,y)\mathrm{d}x\mathrm{d}y}$
二元连续型随机变量的边际分布：
- $FX(x)=P{X≤x}=P{X≤x,Y≤+∞}=∫−∞x[∫−∞+∞f(x,y)dy]dxF_X(x)=P\{X \leq x\}=P\{X \leq x, Y \leq +\infty\}=\displaystyle\int_{-\infty}^{x}{\left[\displaystyle\int_{-\infty}^{+\infty}{f(x,y)\mathrm{d}y}\right]\mathrm{d}x}$
- $fX(x)=∫−∞+∞f(x,y)dyf_X(x)=\displaystyle\int_{-\infty}^{+\infty}{f(x,y)\mathrm{d}y}$
- $FY(y)=P{Y≤y}=P{X≤+∞,Y≤y}=∫−∞y[∫−∞+∞f(x,y)dx]dyF_Y(y)=P\{Y \leq y\}=P\{X \leq +\infty, Y \leq y\}=\displaystyle\int_{-\infty}^{y}{\left[\displaystyle\int_{-\infty}^{+\infty}{f(x,y)\mathrm{d}x}\right]\mathrm{d}y}$
- $fY(y)=∫−∞+∞f(x,y)dxf_Y(y)=\displaystyle\int_{-\infty}^{+\infty}{f(x,y)\mathrm{d}x}$
条件密度函数：
- $fY∣X(y∣x)=f(x,y)fX(x),fX(x)≠0f_{Y|X}(y|x)=\dfrac{f(x,y)}{f_X(x)}, f_X(x) \ne 0$
- $fX∣Y(x∣y)=f(x,y)fY(y),fY(y)≠0f_{X|Y}(x|y)=\dfrac{f(x,y)}{f_Y(y)}, f_Y(y) \ne 0$
设二元随机变量 $(X, Y)$ 具有联合密度函数 $f(x,y)=12πσ1σ21−ρ2exp⁡{−12(1−ρ2)[(x−μ1)2σ12−2ρ(x−μ1)(y−μ2)σ1σ2+(y−μ2)2σ22]}f(x,y)=\dfrac{1}{2\pi\sigma_1\sigma_2\sqrt{1-\rho^2}}\exp\left\{-\dfrac{1}{2(1-\rho^2)}\left[\dfrac{(x-\mu_1)^2}{\sigma_1^2}-2\rho\dfrac{(x-\mu_1)(y-\mu_2)}{\sigma_1\sigma_2}+\dfrac{(y-\mu_2)^2}{\sigma_2^2}\right]\right\}$ ，其中 $∣μ1∣,∣μ2∣<+∞|\mu_1|,|\mu_2|<+\infty$ ， $σ1,σ2>0\sigma_1,\sigma_2>0$ ， $∣ρ∣<1|\rho|<1$ ，则称 $(X, Y)$ 服从参数为 $(μ1,μ2,σ12,σ22,ρ)(\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,\rho)$ 的二元正态分布，记为 $\sim N(\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,\rho)$
- $X, Y$ 的边际分布也是正态分布： $\sim N(\mu_1,\sigma_1^2), Y \sim N(\mu_2,\sigma_2^2)$
- 当给定 ${X=x\}$ 的条件下， $Y$ 的条件分布也是正态分布： $\sim N\left(\mu_2+\rho\dfrac{\sigma_1}{\sigma_2}(x-\mu_1),(1-\rho^2)\sigma_2^2\right)$
- 当给定 ${Y=y\}$ 的条件下， $X$ 的条件分布也是正态分布： $\sim N\left(\mu_1+\rho\dfrac{\sigma_1}{\sigma_2}(y-\mu_2),(1-\rho^2)\sigma_1^2\right)$

随机变量的独立性

对于任意两个实数集合 $D_1,D2$ ，若 $P{X∈D1,Y∈D2}=P{X∈D1}⋅P{Y∈D2}P\{X \in D_1,Y \in D_2\}=P\{X \in D_1\} \cdot P\{Y \in D_2\}$ ，则称随机变量 $X, Y$ 相互独立
当 $F(x,y)=FX(x)⋅FY(y)F(x,y)=F_X(x) \cdot F_Y(y)$ 时， $X, Y$ 相互独立
对于连续型随机变量，被积的密度函数在除了面积为零的区域外处处相等，即 $f(x,y)=fX(x)⋅fY(y)f(x,y)=f_X(x) \cdot f_Y(y)$ ，为相互独立的等价定义
二元连续型随机变量 $X, Y$ 相互独立的充要条件是 $X, Y$ 的联合密度函数 $f (x, y)$ 几乎处处可写成关于 $x$ 的函数 $m (x)$ 和关于 $y$ 的函数 $n (y)$ ，即 $\cdot n(y), |x|<+\infty, |y|<+\infty, f(x,y) \ne 0$

二元随机变量函数的分布

$Z = X + Y$ ：
- $fZ(z)=∫−∞+∞f(x,z−x)dxf_Z(z)=\displaystyle\int_{-\infty}^{+\infty}{f(x,z-x)\mathrm{d}x}$
- $fZ(z)=∫−∞+∞f(z−y,y)dyf_Z(z)=\displaystyle\int_{-\infty}^{+\infty}{f(z-y,y)\mathrm{d}y}$
$M=max⁡(X,Y)M=\max(X,Y)$ ：
- $FM(t)=P{max⁡(X,Y)≤t}=P{X≤t,Y≤t}=F(t,t)F_M(t)=P\{\max(X,Y) \leq t\}=P\{X \leq t, Y \leq t\}=F(t,t)$
- 若 $X, Y$ 相互独立，则 $FM(t)=Fx(t)⋅FY(t)F_M(t)=F_x(t) \cdot F_Y(t)$
$N=min⁡(X,Y)N=\min(X,Y)$ ：
- $FN(t)=P{min⁡(X,Y)≤t}=1−P{min⁡(X,Y)>t}=1−P{X>t,Y>t}F_N(t)=P\{\min(X,Y) \leq t\}=1-P\{\min(X,Y)>t\}=1-P\{X>t, Y>t\}$
- 若 $X, Y$ 相互独立，则 $FN(t)=1−[1−FX(t)]⋅[1−FY(t)]F_N(t)=1-[1-F_X(t)] \cdot [1-F_Y(t)]$

随机变量的数字特征

期望

$∫−∞+∞xf(x)dxE(X)=\displaystyle\sum_{i=1}^{+\infty}{x_ip_i} \ \ \mathrm{or} \ \ \displaystyle\int_{-\infty}^{+\infty}{xf(x)\mathrm{d}x}$
- 泊松分布的期望： $E(X)=∑k=0+∞k⋅(e−λ⋅λkk!)=λe−λ∑k=1+∞λk−1(k−1)!=λe−λ⋅eλ=λE(X)=\displaystyle\sum_{k=0}^{+\infty}{k \cdot \left(e^{-\lambda} \cdot \dfrac{\lambda^k}{k!}\right)}=\lambda e^{-\lambda}\displaystyle\sum_{k=1}^{+\infty}{\dfrac{\lambda^{k-1}}{(k-1)!}}=\lambda e^{-\lambda} \cdot e^{\lambda}=\lambda$
- 指数分布的期望： $E(X)=∫0+∞x⋅λe−λx⋅dx=x⋅(−e−λx)∣0+∞−∫0+∞−e−λxdx=−1λe−λx∣0+∞=1λE(X)=\displaystyle\int_0^{+\infty}{x \cdot \lambda e^{-\lambda x} \cdot \mathrm{d}x}=\left.x \cdot (-e^{-\lambda x})\right|_0^{+\infty}-\displaystyle\int_0^{+\infty}{-e^{-\lambda x}\mathrm{d}x}=\left.-\dfrac1\lambda e^{-\lambda x}\right|_0^{+\infty}=\dfrac1\lambda$
- 标准正态分布的期望： $E(Z)=∫−∞+∞z⋅φ(z)dz=∵f(−z)=−zφ(z)=−f(z)0E(Z)=\displaystyle\int_{-\infty}^{+\infty}{z \cdot \varphi(z)\mathrm{d}z} \xlongequal{\because f(-z)=-z\varphi(z)=-f(z)} 0$
随机变量函数的期望： $∫−∞+∞g(x)f(x)dxE(g(X))=\displaystyle\sum_{i=1}^{+\infty}{g(x_i)p_i} \ \ \mathrm{or} \ \ \displaystyle\int_{-\infty}^{+\infty}{g(x)f(x)\mathrm{d}x}$
二元随机变量函数的期望： $∫−∞+∞∫−∞+∞h(x,y)f(x,y)dxdyE(h(X,Y))=\displaystyle\sum_{i=1}^{+\infty}\displaystyle\sum_{j=1}^{+\infty}{h(x_i, y_i)p_{ij}} \ \ \mathrm{or} \ \ \displaystyle\int_{-\infty}^{+\infty}\displaystyle\int_{-\infty}^{+\infty}{h(x,y)f(x,y)\mathrm{d}x\mathrm{d}y}$
期望的性质： $E(c0+∑i=1nciXi)=c0+∑i=1nciE(Xi)E\left(c_0+\displaystyle\sum_{i=1}^{n}{c_iX_i}\right)=c_0+\displaystyle\sum_{i=1}^{n}{c_iE(X_i)}$
- 正态分布的期望： $\sim N(\mu, \sigma^2) \xRightarrow{Z=\frac{X-\mu}{\sigma} \sim N(0,1)} E(X)=E(\sigma Z+\mu)=\sigma E(Z)+\mu=\mu$
- 二项分布的期望： $E(X)=E(∑i=1nXi)=∑i=1nE(Xi)=∑i=1np=npE(X)=E\left(\displaystyle\sum_{i=1}^{n}{X_i}\right)=\displaystyle\sum_{i=1}^{n}{E(X_i)}=\displaystyle\sum_{i=1}^{n}{p}=np$
对于独立变量： $E(∏i=1nXi)=∏i=1nE(Xi)E\left(\displaystyle\prod_{i=1}^{n}{X_i}\right)=\displaystyle\prod_{i=1}^{n}{E(X_i)}$

方差

$Var(X)=D(X)=E[(X−E(X))2]\mathrm{Var}(X)=D(X)=E[(X-E(X))^2]$
- 标准差： $σ(X)=D(X)\sigma(X)=\sqrt{D(X)}$
- $D(X)=E[X2−2X⋅E(X)+E2(X)]=E(X2)−E(X)⋅2E(X)+E2(X)=E(X2)−E2(X)D(X)=E[X^2-2X \cdot E(X)+E^2(X)]=E(X^2)-E(X) \cdot 2E(X)+E^2(X)=E(X^2)-E^2(X)$
- 泊松分布的方差： $E(X2)=∑k=0+∞k2⋅(e−λ⋅λkk!)=λe−λ∑k=1+∞[(k−1)+1]⋅λk−1(k−1)!=λe−λ[λ∑k=2+∞λk−2(k−2)!+∑k=1+∞λk−1(k−1)!]=λe−λ(λeλ+eλ)=λ2+λ⇒E(X)=λD(X)=λE(X^2)=\displaystyle\sum_{k=0}^{+\infty}{k^2 \cdot \left(e^{-\lambda} \cdot \dfrac{\lambda^k}{k!}\right)}=\lambda e^{-\lambda}\displaystyle\sum_{k=1}^{+\infty}{[(k-1)+1] \cdot \dfrac{\lambda^{k-1}}{(k-1)!}}=\lambda e^{-\lambda}\left[\lambda\displaystyle\sum_{k=2}^{+\infty}{\dfrac{\lambda^{k-2}}{(k-2)!}}+\displaystyle\sum_{k=1}^{+\infty}{\dfrac{\lambda^{k-1}}{(k-1)!}}\right]=\lambda e^{-\lambda}\left(\lambda e^{\lambda}+e^{\lambda}\right)=\lambda^2+\lambda \xRightarrow{E(X)=\lambda} D(X)=\lambda$
- 指数分布的方差： $E(X2)=∫0+∞x2⋅λe−λx⋅dx=x2⋅(−e−λx)∣0+∞−∫0+∞2x⋅(−e−λx)dx=2∫0+∞xe−λxdx=2λE(X)⇒E(X)=1λD(X)=1λ2E(X^2)=\displaystyle\int_0^{+\infty}{x^2 \cdot \lambda e^{-\lambda x} \cdot \mathrm{d}x}=\left.x^2 \cdot (-e^{-\lambda x})\right|_0^{+\infty}-\displaystyle\int_0^{+\infty}{2x \cdot (-e^{-\lambda x})\mathrm{d}x}=2\displaystyle\int_0^{+\infty}{xe^{-\lambda x}\mathrm{d}x}=\dfrac2\lambda E(X) \xRightarrow{E(X)=\frac1\lambda} D(X)=\dfrac1{\lambda^2}$
- 标准正态分布的方差： $D (X) = 1$
方差的性质： $D(c0+∑i=1nciXi)=∑i=1nci2D(Xi)D\left(c_0+\displaystyle\sum_{i=1}^{n}{c_iX_i}\right)=\displaystyle\sum_{i=1}^{n}{c_i^2D(X_i)}$
- 二项分布的方差： $D(X)=D(∑i=1nXi)=∑i=1nD(Xi)=∑i=1np(1−p)=np(1−p)D(X)=D\left(\displaystyle\sum_{i=1}^{n}{X_i}\right)=\displaystyle\sum_{i=1}^{n}{D(X_i)}=\displaystyle\sum_{i=1}^{n}{p(1-p)}=np(1-p)$

协方差

$Cov(X,Y)=E[(X−E(X))(Y−E(Y))]=E(XY)−E(X)E(Y)\mathrm{Cov}(X,Y)=E[(X-E(X))(Y-E(Y))]=E(XY)-E(X)E(Y)$
- 离散型： $Cov(X,Y)=∑i=1+∞∑j=1+∞(xi−E(X))(yj−E(Y))pij\mathrm{Cov}(X,Y)=\displaystyle\sum_{i=1}^{+\infty}\displaystyle\sum_{j=1}^{+\infty}{(x_i-E(X))(y_j-E(Y))p_{ij}}$
- 连续型： $Cov(X,Y)=∫−∞+∞∫−∞+∞(x−E(X))(y−E(Y))f(x,y)dxdy\mathrm{Cov}(X,Y)=\displaystyle\int_{-\infty}^{+\infty}\displaystyle\int_{-\infty}^{+\infty}{(x-E(X))(y-E(Y))f(x,y)\mathrm{d}x\mathrm{d}y}$
设 $X1,X2,…,XnX_1,X_2,\dots,X_n$ 为方差存在的随机变量，则 $Var(∑i=1nXi)=∑i=1nVar(Xi)+2∑1≤i<j≤nCov(Xi,Xj)\mathrm{Var}\left(\displaystyle\sum_{i=1}^n{X_i}\right)=\displaystyle\sum_{i=1}^n{\mathrm{Var}(X_i)}+2\displaystyle\sum_{1 \leq i<j \leq n}{\mathrm{Cov}(X_i, X_j)}$
协方差的性质：
- $Cov(X,Y)=Cov(Y,X)\mathrm{Cov}(X, Y)=\mathrm{Cov}(Y, X)$
- $Cov(X,X)=Var(X)\mathrm{Cov}(X, X)=\mathrm{Var}(X)$
- $Cov(aX,bY)=abCov(X,Y)\mathrm{Cov}(aX, bY)=ab\mathrm{Cov}(X, Y)$
- 若 $Cov(Xi,Y)\mathrm{Cov}(X_i, Y)$ 存在，则 $Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y)\mathrm{Cov}(X_1+X_2, Y)=\mathrm{Cov}(X_1, Y)+\mathrm{Cov}(X_2, Y)$
- 若 $X, Y$ 相互独立，则 $Cov(X,Y)=0\mathrm{Cov}(X,Y)=0$ ，但反之不然
- 当 $Var(X)⋅Var(Y)≠0\mathrm{Var}(X) \cdot \mathrm{Var}(Y) \ne 0$ 时，有 $Var2(X,Y)≤Var(X)⋅Var(Y)\mathrm{Var}^2(X,Y) \leq \mathrm{Var}(X) \cdot \mathrm{Var}(Y)$ ，等号成立当且仅当 $X, Y$ 之间有严格的线性关系，即存在常数 $c_1,c_2$ 使得 $P\{Y=c_1+c_2X\}=1$

上 $α\alpha$ 分位数

设连续型随机变量的分布函数 $F (x)$ 和密度函数 $f (x)$ ，对任意 $0<α<10<\alpha<1$ ，称满足条件 $1−F(xα)=∫xα+∞f(x)dx=α1-F(x_\alpha)=\displaystyle\int_{x_\alpha}^{+\infty}{f(x)\mathrm{d}x}=\alpha$ 的实数 $xαx_\alpha$ 为随机变量 $X$ 的上 $α\alpha$ 分位数
由正态分布对称性， $z1−α=−zαz_{1-\alpha}=-z_\alpha$

协方差矩阵

记 $n$ 元随机变量 $,Xn)T\bm{X}=(X_1,X_2,\cdots,X_n)^T$ ，若其每一分量的方差都存在，则称 $Cov(X)=E[(X−E(X))(X−E(X))T]=[Cov(Xi,Xj)]n×n\mathrm{Cov}(\bm{X})=E[(\bm{X}-E(\bm{X}))(\bm{X}-E(\bm{X}))^T]=[\mathrm{Cov}(X_i,X_j)]_{n \times n}$ 为 $n$ 元随机变量 $X\bm{X}$ 的协方差矩阵
$n$ 元随机变量 $,Xn)T\bm{X}=(X_1,X_2,\cdots,X_n)^T$ ，它的每一分量的方差都存在，记 $X\bm{X}$ 的协方差矩阵为 $B=Cov(X)\bm{B}=\mathrm{Cov}(\bm{X})$ ，数学期望为 $a=E(X)=(E(X1),E(X2),…,E(Xn))T\bm{a}=E(\bm{X})=(E(X_1),E(X_2),\dots,E(X_n))^T$ ，则由密度函数 $f(x)=1(2π)n∣B∣exp⁡[−12(x−a)TB−1(x−a)]f(\bm{x})=\dfrac{1}{\sqrt{(2\pi)^n|\bm{B}|}}\exp\left[-\dfrac12(\bm{x}-\bm{a})^T\bm{B}^{-1}(\bm{x}-\bm{a})\right]$ 定义的分布为 $n$ 元正态分布，常记为 $X∼N(a,B)\bm{X} \sim N(\bm{a},\bm{B})$ ，其中 $x=(x1,x2,…,xn)T\bm{x}=(x_1,x_2,\dots,x_n)^T$ ， $∣B∣=det⁡B|\bm{B}|=\det\bm{B}$
- 二元正态分布的协方差矩阵： $B=(σ12σ1σ2ρσ2σ1ρσ22)\bm{B}=\begin{pmatrix}\sigma_1^2 & \sigma_1\sigma_2\rho \\ \sigma_2\sigma_1\rho & \sigma_2^2\end{pmatrix}$
- $n$ 元正态变量 $,Xn)T(X_1,X_2,\cdots,X_n)^T$ 中的任意 $k$ 元子向量 $(Xi1,Xi2,…,Xik)T(X_{i_1},X_{i_2},\dots,X_{i_k})^T$ 也服从 $k$ 元正态分布；特别地， $n$ 元正态变量的每一个分量都服从一元正态分布；反之，若 $X_i$ 都是相互独立的正态变量，则 $,Xn)T(X_1,X_2,\cdots,X_n)^T$ 服从 $n$ 元正态分布
- $,Xn)T\bm{X}=(X_1,X_2,\cdots,X_n)^T$ 服从 $n$ 元正态分布的充要条件是任意关于分量的线性组合均服从一元正态分布，即对任意 $n$ 元实向量 $l=(l1,l2,…,ln)T\bm{l}=(l_1,l_2,\dots,l_n)^T$ ，其中 $∣l∣≠0|\bm{l}| \ne 0$ ，有 $lTB=∑i=1nliXi∼N(lTa,lTBl)\bm{X} \sim N(\bm{a},\bm{B}) \iff \bm{l}^T\bm{B}=\displaystyle\sum_{i=1}^n{l_iX_i} \sim N(\bm{l}^T\bm{a},\bm{l}^T\bm{B}\bm{l})$
- 正态变量线性变换不变性：对于 $n$ 元正态变量 $,Xn)T\bm{X}=(X_1,X_2,\cdots,X_n)^T$ ，若 $Y1,Y2,…,YkY_1,Y_2,\dots,Y_k$ 都是 $X1,X2,…,XnX_1,X_2,\dots,X_n$ 的线性函数，则 $Y=(Y1,Y2,…,Yk)T\bm{Y}=(Y_1,Y_2,\dots,Y_k)^T$ 服从 $k$ 元正态分布，用矩阵形式表述，若 $X∼N(a,B),C=[cij]k×n\bm{X} \sim N(\bm{a},\bm{B}),\bm{C}=[c_{ij}]_{k \times n}$ ，则 $Y=CX∼N(Ca,CBCT)\bm{Y}=\bm{C}\bm{X} \sim N(\bm{C}\bm{a},\bm{C}\bm{B}\bm{C}^T)$

大数定律及中心极限定理

依概率收敛

设 ${Yn,n≥1}\{Y_n, n\ge 1\}$ 为一随机变量序列， $c$ 为一常数，若对任意的 $ε>0\varepsilon>0$ ，都有 $lim⁡n→+∞P{∣Yn−c∣≥ε}=0\displaystyle\lim_{n \to +\infty}{P\{|Y_n-c| \ge \varepsilon\}}=0$ 成立，则称 ${Yn,n≥1}\{Y_n, n\ge 1\}$ 依概率收敛于 $c$ ，记为 $Yn→Pc,n→+∞Y_n \xrightarrow{P} c, n \to +\infty$
- 等价表示： $lim⁡n→+∞P{∣Yn−c∣<ε}=1\displaystyle\lim_{n \to +\infty}{P\{|Y_n-c|<\varepsilon\}}=1$
设 $Xn→Pa,Yn→Pb,n→+∞X_n \xrightarrow{P} a, Y_n \xrightarrow{P} b, n \to +\infty$ ，其中 $a, b$ 为常数，若二元函数 $g (x, y)$ 在点 $(a, b)$ 处连续，则有 $g(Xn,Yn)→Pg(a,b),n→+∞g(X_n,Y_n) \xrightarrow{P} g(a,b), n \to +\infty$

马尔可夫（Markov）不等式

若随机变量 $Y$ 的 $k$ 阶（原点）矩存在，则对任意的 $ε>0\varepsilon>0$ ，有 $P{∣Y∣≥ε}≤E(∣Y∣k)εkP\{|Y| \ge \varepsilon\} \leq \dfrac{E(|Y|^k)}{\varepsilon^k}$
- 证明：构造 $Z={ε,∣Y∣≥ε0,∣Y∣<εZ=\begin{cases}\varepsilon, & |Y| \ge \varepsilon \\ 0, & |Y|<\varepsilon\end{cases}$ ，则 $Zk≤∣Y∣kZ^k \leq |Y|^k$ ，故 $E(Zk)≤E(∣Y∣k)E(Z^k) \leq E(|Y|^k)$ ，注意到 $E(Zk)=εk⋅P{∣Y∣≥ε}E(Z^k)=\varepsilon^k \cdot P\{|Y| \ge \varepsilon\}$ ，因此 $P{∣Y∣≥ε}=E(Zk)εk≤E(∣Y∣k)εkP\{|Y| \ge \varepsilon\}=\dfrac{E(Z^k)}{\varepsilon^k} \leq \dfrac{E(|Y|^k)}{\varepsilon^k}$

切比雪夫（Chebyshev）不等式

设随机变量 $X$ 存在期望 $μ\mu$ 和方差 $σ2\sigma^2$ ，则对任意的 $ε>0\varepsilon>0$ ，有 $P{∣X−μ∣≥ε}≤σ2ε2P\{|X-\mu| \ge \varepsilon\} \leq \dfrac{\sigma^2}{\varepsilon^2}$
- 证明：取 $Y=X−μ,k=2Y=X-\mu,k=2$ ，利用马尔可夫不等式即可

弱大数定律

设随机变量序列 ${Yi,i≥1}\{Y_i, i \ge 1\}$ ，若存在常数序列 ${cn,n≥1}\{c_n, n \ge 1\}$ ，使得对任意的 $ε>0\varepsilon>0$ ，有 $lim⁡n→+∞P{∣1n∑i=1nYi−cn∣≥ε}=0\displaystyle\lim_{n \to +\infty}{P\left\{\left|\dfrac1n\displaystyle\sum_{i=1}^n{Y_i}-c_n\right| \ge \varepsilon\right\}}=0$ ，则称 ${Yi,i≥1}\{Y_i, i \ge 1\}$ 服从弱大数定律，记作 $1n∑i=1nYi−cn→P0,n→+∞\dfrac1n\displaystyle\sum_{i=1}^n{Y_i}-c_n \xrightarrow{P} 0, n \to +\infty$
- 特别地，当 $cn≡cc_n \equiv c$ 时，可记为 $1n∑i=1nYi→Pc,n→+∞\dfrac1n\displaystyle\sum_{i=1}^n{Y_i} \xrightarrow{P} c, n \to +\infty$

伯努利（Bernoulli）大数定律

设 $n_A$ 为 $n$ 重伯努利试验中事件 $A$ 发生的次数， $p$ 为事件 $A$ 发生的概率，则对任意的 $ε>0\varepsilon>0$ ，有 $lim⁡n→+∞P{∣nAn−p∣≥ε}=0\displaystyle\lim_{n \to +\infty}{P\left\{\left|\dfrac{n_A}{n}-p\right| \ge \varepsilon\right\}}=0$

辛钦（Khinchin）大数定律

设 ${Xi,i≥1}\{X_i, i \ge 1\}$ 为独立同分布的随机变量序列，且存在期望 $μ\mu$ ，则对任意的 $ε>0\varepsilon>0$ ，有 $lim⁡n→+∞P{∣1n∑i=1nXi−μ∣≥ε}=0\displaystyle\lim_{n \to +\infty}{P\left\{\left|\dfrac1n\displaystyle\sum_{i=1}^n{X_i}-\mu\right| \ge \varepsilon\right\}}=0$

林德伯格（Lindeberg）-莱维（Lévy）中心极限定理

设 ${Xi,i≥1}\{X_i, i \ge 1\}$ 为独立同分布的随机变量序列，且存在期望 $E(Xi)=μE(X_i)=\mu$ 和方差 $D(Xi)=σ2D(X_i)=\sigma^2$ ，则对任意的 $\in \mathbb{R}$ ， $lim⁡n→+∞P{∑i=1nXi−E(∑i=1nXi)D(∑i=1nXi)≤x}=lim⁡n→+∞P{∑i=1nXi−nμσn≤x}=Φ(x)\displaystyle\lim_{n \to +\infty}{P\left\{\dfrac{\displaystyle\sum_{i=1}^n{X_i}-E\left(\displaystyle\sum_{i=1}^n{X_i}\right)}{\sqrt{D\left(\displaystyle\sum_{i=1}^n{X_i}\right)}} \leq x\right\}}=\displaystyle\lim_{n \to +\infty}{P\left\{\dfrac{\displaystyle\sum_{i=1}^n{X_i}-n\mu}{\sigma\sqrt{n}} \leq x\right\}}=\Phi(x)$
- 推论：当 $n$ 充分大时， $∑i=1nXi−nμσn=1n∑i=1nXi−μσ/n=X‾−μσ/n∼N(0,1)\dfrac{\displaystyle\sum_{i=1}^n{X_i}-n\mu}{\sigma\sqrt{n}}=\dfrac{\dfrac1n\displaystyle\sum_{i=1}^n{X_i}-\mu}{\sigma/\sqrt{n}}=\dfrac{\overline{X}-\mu}{\sigma/\sqrt{n}} \sim N(0,1)$

棣莫弗（De Moivre）-拉普拉斯（Laplace）中心极限定理

设 $n_A$ 为 $n$ 重伯努利试验中事件 $A$ 发生的次数， $p$ 为事件 $A$ 发生的概率，则对任意的 $\in \mathbb{R}$ ，有 $lim⁡n→+∞P{nA−npnp(1−p)≤x}=Φ(x)\displaystyle\lim_{n \to +\infty}{P\left\{\dfrac{n_A-np}{\sqrt{np(1-p)}} \leq x\right\}}=\Phi(x)$

统计量与抽样分布

统计量

样本均值 $X‾=1n∑i=1nXi\overline{X}=\dfrac1n\displaystyle\sum_{i=1}^n{X_i}$
样本方差 $S2=1n−1∑i=1n(Xi−X‾)2=1n−1(∑i=1nXi2−nX‾2)S^2=\dfrac1{n-1}\displaystyle\sum_{i=1}^n{(X_i-\overline{X})^2}=\dfrac1{n-1}\left(\displaystyle\sum_{i=1}^n{X_i^2}-n\overline{X}^2\right)$
样本标准差 $S=S2=1n−1∑i=1n(Xi−X‾)2S=\sqrt{S^2}=\sqrt{\dfrac1{n-1}\displaystyle\sum_{i=1}^n{(X_i-\overline{X})^2}}$
样本 $k$ 阶（原点）矩 $Ak=1n∑i=1nXik,k∈N+A_k=\dfrac1n\displaystyle\sum_{i=1}^n{X_i^k}, k \in \mathbb{N}^+$
样本 $k$ 阶中心矩 $Bk=1n∑i=1n(Xi−X‾)k,k∈N+B_k=\dfrac1n\displaystyle\sum_{i=1}^n{(X_i-\overline{X})^k}, k \in \mathbb{N}^+$

$χ2\chi^2$ 分布

设 $X1,X2,…,XnX_1,X_2,\dots,X_n$ 为独立同分布的随机变量，且都服从 $N (0, 1)$ ，令 $Y=X12+X22+⋯+Xn2Y=X_1^2+X_2^2+\cdots+X_n^2$ ，则称 $Y$ 服从自由度为 $n$ 的 $χ2\chi^2$ 分布，记作 $\sim \chi^2(n)$
- $E(χ2(n))=∑i=1nE(Xi2)=∑i=1n[E(Xi)+D(Xi)]=nE(\chi^2(n))=\displaystyle\sum_{i=1}^n{E(X_i^2)}=\displaystyle\sum_{i=1}^n{[E(X_i)+D(X_i)]}=n$
- $D(χ2(n))=∑i=1nD(Xi2)=∑i=1n[E(Xi4)−(E(Xi2))2]=∵E(Z4)=32nD(\chi^2(n))=\displaystyle\sum_{i=1}^n{D(X_i^2)}=\displaystyle\sum_{i=1}^n{[E(X_i^4)-(E(X_i^2))^2]} \xlongequal{\because E(Z^4)=3} 2n$

$t$ 分布

设 $\sim N(0,1), Y \sim \chi^2(n)$ ，且 $X, Y$ 相互独立，则称随机变量 $t=XY/nt=\dfrac{X}{\sqrt{Y/n}}$ 服从自由度为 $n$ 的 $t$ 分布，记作 $\sim t(n)$
- $t1−α(n)=−tα(n)t_{1-\alpha}(n)=-t_\alpha(n)$

$F$ 分布

设 $\sim \chi^2(n_1), V \sim \chi^2(n_2)$ ，且 $U, V$ 相互独立，则称随机变量 $F=U/n1V/n2F=\dfrac{U/n_1}{V/n_2}$ 服从自由度为 $n_1,n_2)$ 的 $F$ 分布，记作 $\sim F(n_1,n_2)$
- 若 $\sim F(n_1,n_2)$ ，则 $1F∼F(n2,n1)\dfrac1F \sim F(n_2,n_1)$
- 若 $\sim t(n)$ ，则 $X2∼F(1,n)X^2 \sim F(1,n)$
- $F1−α(n1,n2)=1Fα(n2,n1)F_{1-\alpha}(n_1,n_2)=\dfrac{1}{F_\alpha(n_2,n_1)}$

正态总体下的抽样分布

设 $X1,X2,…,XnX_1,X_2,\dots,X_n$ 为来自正态总体 $N(μ,σ2)N(\mu,\sigma^2)$ 的简单随机样本，样本均值 $X‾\overline{X}$ ，样本方差 $S^2$ ，则有
- $X‾∼N(μ,σ2n)\overline{X} \sim N\left(\mu, \dfrac{\sigma^2}{n}\right)$
- $(n−1)S2σ2∼χ2(n−1)\dfrac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)$
- $X‾\overline{X}$ 与 $S^2$ 相互独立
- $X‾−μS/n=X‾−μσ2/n/(n−1)S2σ2(n−1)∼t(n−1)\dfrac{\overline{X}-\mu}{S/\sqrt{n}}=\left.\dfrac{\overline{X}-\mu}{\sqrt{\sigma^2/n}} \middle/ \sqrt{\dfrac{(n-1)S^2}{\sigma^2(n-1)}} \right.\sim t(n-1)$
设 $X1,X2,…,Xn1X_1,X_2,\dots,X_{n_1}$ 和 $Y1,Y2,…,Yn2Y_1,Y_2,\dots,Y_{n_2}$ 分别为来自正态总体 $N(μ1,σ12)N(\mu_1,\sigma_1^2)$ 和 $N(μ2,σ22)N(\mu_2,\sigma_2^2)$ 的简单随机样本，样本均值 $X‾\overline{X}$ 和 $Y‾\overline{Y}$ ，样本方差 $S_1^2$ 和 $S_2^2$ ，则有
- $S12/σ12S22/σ22=(n1−1)S12σ12/(n1−1)(n2−1)S22σ22/(n2−1)∼F(n1−1,n2−1)\dfrac{S_1^2/\sigma_1^2}{S_2^2/\sigma_2^2}=\dfrac{\left.\dfrac{(n_1-1)S_1^2}{\sigma_1^2} \middle/ (n_1-1)\right.}{\left.\dfrac{(n_2-1)S_2^2}{\sigma_2^2} \middle/ (n_2-1)\right.} \sim F(n_1-1,n_2-1)$
- 当 $σ12=σ22=σ2\sigma_1^2=\sigma_2^2=\sigma^2$ 时， $X‾−Y‾∼N(μ1−μ2,σ2n1+σ2n2)\overline{X}-\overline{Y} \sim N\left(\mu_1-\mu_2,\dfrac{\sigma^2}{n_1}+\dfrac{\sigma^2}{n_2}\right)$ ，令 $U=(X‾−Y‾)−(μ1−μ2)σ2n1+σ2n2∼N(0,1)U=\dfrac{(\overline{X}-\overline{Y})-(\mu_1-\mu_2)}{\sqrt{\dfrac{\sigma^2}{n_1}+\dfrac{\sigma^2}{n_2}}} \sim N(0,1)$ 和 $V=(n1−1)S12σ2+(n2−1)S22σ2∼χ2(n1+n2−2)V=\dfrac{(n_1-1)S_1^2}{\sigma^2}+\dfrac{(n_2-1)S_2^2}{\sigma^2} \sim \chi^2(n_1+n_2-2)$ ，记 $Sw2=(n1−1)S12+(n2−1)S22n1+n2−2S_w^2=\dfrac{(n_1-1)S_1^2+(n_2-1)S_2^2}{n_1+n_2-2}$ ，则 $(X‾−Y‾)−(μ1−μ2)Sw1n1+1n2=UV/(n1+n2−2)∼t(n1+n2−2)\dfrac{(\overline{X}-\overline{Y})-(\mu_1-\mu_2)}{S_w\sqrt{\dfrac{1}{n_1}+\dfrac{1}{n_2}}}=\dfrac{U}{\sqrt{V/(n_1+n_2-2)}} \sim t(n_1+n_2-2)$

参数估计

矩估计

设 $θ1,θ2,…,θm\theta_1,\theta_2,\dots,\theta_m$ 是总体 $X$ 的带估计参数，并假定 $X$ 的前 $m$ 阶矩存在，矩估计的步骤如下：
- 求总体 $X$ 的前 $m$ 阶矩（不妨设是原点矩） $μ1,μ2,…,μm\mu_1,\mu_2,\dots,\mu_m$ ，一般地，这些矩可以写成待估计参数 $θ1,θ2,…,θm\theta_1,\theta_2,\dots,\theta_m$ 的函数形式，记为 ${μ1=E(X)=g1(θ1,θ2,…,θm)μ2=E(X2)=g2(θ1,θ2,…,θm)⋯⋯μm=E(Xm)=gm(θ1,θ2,…,θm)\begin{cases}\mu_1=E(X)=g_1(\theta_1,\theta_2,\dots,\theta_m) \\ \mu_2=E(X^2)=g_2(\theta_1,\theta_2,\dots,\theta_m) \\ \cdots \cdots \\ \mu_m=E(X^m)=g_m(\theta_1,\theta_2,\dots,\theta_m)\end{cases}$
- 由上述方程组可以反解出 $θ1,θ2,…,θm\theta_1,\theta_2,\dots,\theta_m$ 关于前 $m$ 阶矩的函数表达式，记为 ${θ1=h1(μ1,μ2,…,μm)θ2=h2(μ1,μ2,…,μm)⋯⋯θm=hm(μ1,μ2,…,μm)\begin{cases}\theta_1=h_1(\mu_1,\mu_2,\dots,\mu_m) \\ \theta_2=h_2(\mu_1,\mu_2,\dots,\mu_m) \\ \cdots \cdots \\ \theta_m=h_m(\mu_1,\mu_2,\dots,\mu_m)\end{cases}$
- 以原点矩 $A_i$ 代替 $μi\mu_i$ ，得到各个参数的点估计量 ${θ^1=h1(A1,A2,…,Am)θ^2=h2(A1,A2,…,Am)⋯⋯θ^m=hm(A1,A2,…,Am)\begin{cases}\hat{\theta}_1=h_1(A_1,A_2,\dots,A_m) \\ \hat{\theta}_2=h_2(A_1,A_2,\dots,A_m) \\ \cdots \cdots \\ \hat{\theta}_m=h_m(A_1,A_2,\dots,A_m)\end{cases}$
矩估计中也可以用部分总体中心距 $νi\nu_i$ 代替原点矩 $μi\mu_i$ ，用样本中心距 $B_i$ 代替原点矩 $A_i$

极大似然估计

似然函数 $L(θ)L(\theta)$ ：
- 设 $X$ 为离散型总体，其概率分布律为 $P{X=x}=p(x;θ)P\{X=x\}=p(x;\theta)$ ， $θ∈Θ\theta \in \Theta$ 是未知的待估参数， $Θ\Theta$ 为参数空间， $X1,X2,…,XnX_1,X_2,\dots,X_n$ 是来自总体 $X$ 的样本，设 $x1,x2,…,xnx_1,x_2,\dots,x_n$ 是已经得到的样本值，则样本 $X1,X2,…,XnX_1,X_2,\dots,X_n$ 取到值 $x1,x2,…,xnx_1,x_2,\dots,x_n$ 的概率为 $P{X1=x1,X2=x2,…,Xn=xn}=∏i=1nP{Xi=xi}=∏i=1np(xi;θ)P\{X_1=x_1,X_2=x_2,\dots,X_n=x_n\}=\displaystyle\prod_{i=1}^n{P\{X_i=x_i\}}=\displaystyle\prod_{i=1}^n{p(x_i;\theta)}$ ，记似然函数 $L(θ)=L(θ;x1,x2,…,xn)=∏i=1np(xi;θ)L(\theta)=L(\theta;x_1,x_2,\dots,x_n)=\displaystyle\prod_{i=1}^n{p(x_i;\theta)}$
- 当 $X$ 为连续型总体时，设有密度函数 $f(x;θ)f(x;\theta)$ ， $θ∈Θ\theta \in \Theta$ 是未知的待估参数， $Θ\Theta$ 为参数空间， $X1,X2,…,XnX_1,X_2,\dots,X_n$ 是来自总体 $X$ 的样本，设 $x1,x2,…,xnx_1,x_2,\dots,x_n$ 是已经得到的样本值，此时似然函数 $L(θ)=L(θ;x1,x2,…,xn)=∏i=1nf(xi;θ)L(\theta)=L(\theta;x_1,x_2,\dots,x_n)=\displaystyle\prod_{i=1}^n{f(x_i;\theta)}$
极大似然估计寻求参数 $θ\theta$ 的估计值 $θ^\hat\theta$ ，使得 $L(θ)L(\theta)$ 取到极大值，即 $L(θ^)=max⁡θ∈ΘL(θ;x1,x2,…,xn)L(\hat\theta)=\displaystyle\max_{\theta \in \Theta}{L(\theta;x_1,x_2,\dots,x_n)}$ ，此时
- $θ^=θ^(x1,x2,…,xn)\hat\theta=\hat\theta(x_1,x_2,\dots,x_n)$ 称为极大似然估计值
- 相应的统计量 $θ^(X1,X2,…,Xn)\hat\theta(X_1,X_2,\dots,X_n)$ 称为极大似然估计量，简记为 $MLE\mathrm{MLE}$
寻求极大似然估计常常采用微分方法：
- 求解似然方程 $∂L(θ)∂θ∣θ=θ^=0\left.\dfrac{\partial L(\theta)}{\partial \theta}\right|_{\theta=\hat\theta}=0$
- 为了计算方便，往往事先进行取对数操作，记 $l(θ)=ln⁡L(θ)l(\theta)=\ln L(\theta)$ 为对数似然函数
- 此时求解对数似然方程 $∂l(θ)∂θ∣θ=θ^=∂ln⁡L(θ)∂θ∣θ=θ^=0\left.\dfrac{\partial l(\theta)}{\partial \theta}\right|_{\theta=\hat\theta}=\left.\dfrac{\partial\ln L(\theta)}{\partial \theta}\right|_{\theta=\hat\theta}=0$
极大似然估计的不变性：设参数 $θ\theta$ 的极大似然估计为 $θ^\hat\theta$ ， $θ∗=g(θ)\theta^*=g(\theta)$ 是 $θ\theta$ 的连续函数，则参数 $θ∗\theta^*$ 的极大似然估计为 $θ^∗=g(θ^)\hat\theta^*=g(\hat\theta)$

无偏性准则

设 $θ∈Θ\theta \in \Theta$ 是总体 $X$ 的待估参数， $X1,X2,…,XnX_1,X_2,\dots,X_n$ 是来自总体 $X$ 的样本，若估计量 $θ^(X1,X2,…,Xn)\hat\theta(X_1,X_2,\dots,X_n)$ 的期望存在，且满足 $E(θ^)=θ,∀θ∈ΘE(\hat\theta)=\theta, \forall \theta \in \Theta$ ，则称 $θ^\hat\theta$ 是 $θ\theta$ 的无偏估计
- 若 $E(θ^)≠θE(\hat\theta) \ne \theta$ ，则称 $E(θ^)−θE(\hat\theta)-\theta$ 为估计量 $θ^\hat\theta$ 的偏差
- 若 $E(θ^)≠θE(\hat\theta) \ne \theta$ ，但 $lim⁡n→+∞E(θ^)=θ\displaystyle\lim_{n \to +\infty}{E(\hat\theta)}=\theta$ ，则称 $θ^\hat\theta$ 是 $θ\theta$ 的渐进无偏估计

有效性准则

设 $θ^1=θ^1(X1,X2,…,Xn)\hat\theta_1=\hat\theta_1(X_1,X_2,\dots,X_n)$ 与 $θ^2=θ^2(X1,X2,…,Xn)\hat\theta_2=\hat\theta_2(X_1,X_2,\dots,X_n)$ 都是参数 $θ\theta$ 的无偏估计，若 $∀θ∈Θ\forall \theta \in \Theta$ ，有 $Varθ(θ^1)≤Varθ(θ^2)\mathrm{Var}_\theta(\hat\theta_1) \leq \mathrm{Var}_\theta(\hat\theta_2)$ ，且至少有一个 $θ\theta$ 使不等号成立，则称 $θ^1\hat\theta_1$ 比 $θ^2\hat\theta_2$ 有效

均方误差准则

设 $θ^=θ^(X1,X2,…,Xn)\hat\theta=\hat\theta(X_1,X_2,\dots,X_n)$ 是参数 $θ\theta$ 的一般估计量，称 $E[(θ^−θ)2]E[(\hat\theta-\theta)^2]$ 是估计量 $θ^\hat\theta$ 的均方误差，记作 $Mse(θ^)=Var(θ^)+(E(θ^)−θ)2\mathrm{Mse}(\hat\theta)=\mathrm{Var}(\hat\theta)+(E(\hat\theta)-\theta)^2$
设 $θ^1\hat\theta_1$ 与 $θ^2\hat\theta_2$ 都是参数 $θ\theta$ 的估计量，若 $∀θ∈Θ\forall \theta \in \Theta$ ，有 $Mse(θ^1)≤Mse(θ^2)\mathrm{Mse}(\hat\theta_1) \leq \mathrm{Mse}(\hat\theta_2)$ ，且至少有一个 $θ\theta$ 使不等号成立，则称 $θ^1\hat\theta_1$ 优于 $θ^2\hat\theta_2$
若 $θ^\hat\theta$ 是参数 $θ\theta$ 的无偏估计，即 $E(θ^)=θE(\hat\theta)=\theta$ ，则 $Mse(θ^)=Var(θ^)\mathrm{Mse}(\hat\theta)=\mathrm{Var}(\hat\theta)$
当用于无偏估计之间的比较时，均方误差准则等价于有效性准则

相合性准则

设 $θ^n=θ^(X1,X2,…,Xn)\hat\theta_n=\hat\theta(X_1,X_2,\dots,X_n)$ 是参数 $θ\theta$ 的一般估计量，若对于任意 $ε>0\varepsilon>0$ ，有 $lim⁡n→+∞P{∣θ^n−θ∣<ε}=1\displaystyle\lim_{n \to +\infty}{P\{|\hat\theta_n-\theta|<\varepsilon\}}=1$ ，即 $θ^n\hat\theta_n$ 依概率收敛于 $θ\theta$ ，则称 $θ^n\hat\theta_n$ 是 $θ\theta$ 的相合估计量，记作 $θ^n→Pθ\hat\theta_n \xrightarrow{P} \theta$
一般地，矩估计得到的参数估计都满足相合性，极大似然估计在总体分布满足一定条件下求得的参数估计才是相合估计量

单个正态总体的参数区间估计

均值 $μ\mu$ 的置信区间（ $σ2\sigma^2$ 已知）：
- 常用 $μ\mu$ 的点估计为样本均值 $X‾\overline{X}$ ，有 $X‾∼N(μ,σ2n)\overline{X} \sim N\left(\mu,\dfrac{\sigma^2}{n}\right)$ ，即 $X‾−μσ/n∼N(0,1)\dfrac{\overline{X}-\mu}{\sigma/\sqrt{n}} \sim N(0,1)$
- 取枢轴量 $G(X1,X2,…,Xn;μ)=X‾−μσ/nG(X_1,X_2,\dots,X_n;\mu)=\dfrac{\overline{X}-\mu}{\sigma/\sqrt{n}}$
- 设常数 $a < b$ ，且满足 $P{a<X‾−μσ/n<b}=P{X‾−bσn<μ<X‾−aσn}=1−αP\left\{a<\dfrac{\overline{X}-\mu}{\sigma/\sqrt{n}}<b\right\}=P\left\{\overline{X}-b\dfrac{\sigma}{\sqrt{n}}<\mu<\overline{X}-a\dfrac{\sigma}{\sqrt{n}}\right\}=1-\alpha$
- 区间平均长度 $L=(b−a)σnL=(b-a)\dfrac{\sigma}{\sqrt{n}}$ ，根据正态分布对称性，令 $a=−b=−zα/2a=-b=-z_{\alpha/2}$ 使区间平均长度最短
- 此时置信区间为 $(X‾−σnzα/2,X‾+σnzα/2)\left(\overline{X}-\dfrac{\sigma}{\sqrt{n}}z_{\alpha/2}, \overline{X}+\dfrac{\sigma}{\sqrt{n}}z_{\alpha/2}\right)$ ，简记为 $(X‾±σnzα/2)\left(\overline{X} \pm \dfrac{\sigma}{\sqrt{n}}z_{\alpha/2}\right)$
均值 $μ\mu$ 的置信区间（ $σ2\sigma^2$ 未知）：
- 考虑 $σ2\sigma^2$ 的无偏估计 $S^2$ ，有 $X‾−μS/n∼t(n−1)\dfrac{\overline{X}-\mu}{S/\sqrt{n}} \sim t(n-1)$
- 取枢轴量 $G(X1,X2,…,Xn;μ)=X‾−μS/nG(X_1,X_2,\dots,X_n;\mu)=\dfrac{\overline{X}-\mu}{S/\sqrt{n}}$
- 有 $P{∣X‾−μS/n∣<tα/2(n−1)}=P{X‾−Sntα/2(n−1)<μ<X‾+Sntα/2(n−1)}=1−αP\left\{\left|\dfrac{\overline{X}-\mu}{S/\sqrt{n}}\right|<t_{\alpha/2}(n-1)\right\}=P\left\{\overline{X}-\dfrac{S}{\sqrt{n}}t_{\alpha/2}(n-1)<\mu<\overline{X}+\dfrac{S}{\sqrt{n}}t_{\alpha/2}(n-1)\right\}=1-\alpha$
- 根据 $t$ 分布对称性，置信区间取 $(X‾±Sntα/2(n−1))\left(\overline{X} \pm \dfrac{S}{\sqrt{n}}t_{\alpha/2}(n-1)\right)$
成对数据情形（不相互独立），均值差 $μ1−μ2\mu_1-\mu_2$ 的置信区间：
- 令 $D_i=X_i-Y_i$ ，则 $D‾=X‾−Y‾,SD2=1n−1∑i=1n(Di−D‾)2\overline{D}=\overline{X}-\overline{Y}, S_D^2=\dfrac{1}{n-1}\displaystyle\sum_{i=1}^n{(D_i-\overline{D})^2}$
- $μD\mu_D$ 的置信区间取 $(D‾±SDntα/2(n−1))\left(\overline{D} \pm \dfrac{S_D}{\sqrt{n}}t_{\alpha/2}(n-1)\right)$
方差 $σ2\sigma^2$ 的置信区间：
- 考虑 $(n−1)S2σ2∼χ2(n−1)\dfrac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)$
- 取枢轴量 $G(X1,X2,…,Xn;σ2)=(n−1)S2σ2G(X_1,X_2,\dots,X_n;\sigma^2)=\dfrac{(n-1)S^2}{\sigma^2}$
- 有 $P{χ1−α/22(n−1)<(n−1)S2σ2<χα/22(n−1)}=P{(n−1)S2χα/22(n−1)<σ2<(n−1)S2χ1−α/22(n−1)}=1−αP\left\{\chi_{1-\alpha/2}^2(n-1)<\dfrac{(n-1)S^2}{\sigma^2}<\chi_{\alpha/2}^2(n-1)\right\}=P\left\{\dfrac{(n-1)S^2}{\chi_{\alpha/2}^2(n-1)}<\sigma^2<\dfrac{(n-1)S^2}{\chi_{1-\alpha/2}^2(n-1)}\right\}=1-\alpha$
- $σ2\sigma^2$ 的置信区间取 $((n−1)S2χα/22(n−1),(n−1)S2χ1−α/22(n−1))\left(\dfrac{(n-1)S^2}{\chi_{\alpha/2}^2(n-1)}, \dfrac{(n-1)S^2}{\chi_{1-\alpha/2}^2(n-1)}\right)$
- 由于 $χ2\chi^2$ 分布的密度函数不对称，故上述置信区间不满足区间平均长度最短，但这样的解给实际应用带来方便

两个正态总体的参数区间估计

均值差 $μ1−μ2\mu_1-\mu_2$ 的置信区间（ $σ2\sigma^2$ 和 $σ22\sigma_2^2$ 已知）：
- 利用 $μ1−μ2\mu_1-\mu_2$ 的无偏估计 $X‾−Y‾\overline{X}-\overline{Y}$ ，有 $X‾−Y‾∼N(μ1−μ2,σ12n+σ22n)\overline{X}-\overline{Y} \sim N\left(\mu_1-\mu_2, \dfrac{\sigma_1^2}{n}+\dfrac{\sigma_2^2}{n}\right)$
- $μ1−μ2\mu_1-\mu_2$ 的置信区间取 $((X‾−Y‾)±zα/2σ12n+σ22n)\left((\overline{X}-\overline{Y}) \pm z_{\alpha/2}\sqrt{\dfrac{\sigma_1^2}{n}+\dfrac{\sigma_2^2}{n}}\right)$
均值差 $μ1−μ2\mu_1-\mu_2$ 的置信区间（ $σ2=σ22=σ2\sigma^2=\sigma_2^2=\sigma^2$ ，但未知）：
- 利用 $Sw2=(n1−1)S12+(n2−1)S22n1+n2−2S_w^2=\dfrac{(n_1-1)S_1^2+(n_2-1)S_2^2}{n_1+n_2-2}$ ，有 $(X‾−Y‾)−(μ1−μ2)Sw1n1+1n2∼t(n1+n2−2)\dfrac{(\overline{X}-\overline{Y})-(\mu_1-\mu_2)}{S_w\sqrt{\dfrac{1}{n_1}+\dfrac{1}{n_2}}} \sim t(n_1+n_2-2)$
- $μ1−μ2\mu_1-\mu_2$ 的置信区间取 $((X‾−Y‾)±tα/2(n1+n2−2)Sw1n1+1n2)\left((\overline{X}-\overline{Y}) \pm t_{\alpha/2}(n_1+n_2-2)S_w\sqrt{\dfrac{1}{n_1}+\dfrac{1}{n_2}}\right)$
方差比 $σ12σ22\dfrac{\sigma_1^2}{\sigma_2^2}$ 的置信区间：
- 利用 $σ12σ22\dfrac{\sigma_1^2}{\sigma_2^2}$ 的点估计 $S12S22\dfrac{S_1^2}{S_2^2}$ ，有 $S12S22/σ12σ22=S12/σ12S22/σ22∼F(n1−1,n2−1)\left.\dfrac{S_1^2}{S_2^2} \middle/ \dfrac{\sigma_1^2}{\sigma_2^2}\right.=\dfrac{S_1^2/\sigma_1^2}{S_2^2/\sigma_2^2} \sim F(n_1-1,n_2-1)$
- $σ12σ22\dfrac{\sigma_1^2}{\sigma_2^2}$ 的置信区间取 $(S12/S22Fα/2(n1+n2−2),S12/S22F1−α/2(n1+n2−2))\left(\dfrac{S_1^2/S_2^2}{F_{\alpha/2}(n_1+n_2-2)}, \dfrac{S_1^2/S_2^2}{F_{1-\alpha/2}(n_1+n_2-2)}\right)$

假设检验

单个正态总体参数的假设检验

均值 $μ\mu$ 的假设检验（ $σ2\sigma^2$ 已知），称为 $Z$ 检验：
- 考虑双侧假设 $H0:μ=μ0,H1:μ≠μ0H_0:\mu=\mu_0,H_1:\mu \ne \mu_0$ ，取检验统计量为 $Z=X‾−μ0σ/nZ=\dfrac{\overline{X}-\mu_0}{\sigma/\sqrt{n}}$ ，拒绝域 $W={∣Z∣=∣X‾−μ0σ/n∣≥zα/2}W=\left\{|Z|=\left|\dfrac{\overline{X}-\mu_0}{\sigma/\sqrt{n}}\right| \ge z_{\alpha/2}\right\}$
  - 对给定样本值 $x1,x2,…,xnx_1,x_2,\dots,x_n$ ，检验统计量 $Z$ 的取值 $z0=x‾−μ0σ/nz_0=\dfrac{\overline{x}-\mu_0}{\sigma/\sqrt{n}}$ ，当 $∣z0∣≥zα/2|z_0| \ge z_{\alpha/2}$ 时，拒绝原假设
  - $P−=PH0{∣Z∣≥∣z0∣}=2PH0{Z≥∣z0∣}=2−2Φ(∣z0∣)P_-=P_{H_0}\{|Z| \ge |z_0|\}=2P_{H_0}\{Z \ge |z_0|\}=2-2\Phi(|z_0|)$ ，当 $P_-$ 值小于等于显著水平 $α\alpha$ 时拒绝原假设
- 考虑左侧假设 $H0:μ≥μ0,H1:μ<μ0H_0:\mu \ge \mu_0,H_1:\mu<\mu_0$ ，取检验统计量为 $Z=X‾−μ0σ/nZ=\dfrac{\overline{X}-\mu_0}{\sigma/\sqrt{n}}$ ，拒绝域 $W={Z=X‾−μ0σ/n≤c}W=\left\{Z=\dfrac{\overline{X}-\mu_0}{\sigma/\sqrt{n}} \leq c\right\}$
  - 犯第 I 类错误的概率 $α(μ,c)=P{X‾−μ0σ/n≤c|μ≥μ0}\alpha(\mu,c)=P\left\{\dfrac{\overline{X}-\mu_0}{\sigma/\sqrt{n}} \leq c \middle| \mu \ge \mu_0\right\}$ ，由于 $Z$ 不服从标准正态分布，而是 $\sim N\left(\dfrac{\mu-\mu_0}{\sigma/\sqrt{n}}, 1\right)$ ，因此 $α(μ,c)=Φ(c−μ−μ0σ/n1)=Φ(c−μ−μ0σ/n),μ≥μ0\alpha(\mu,c)=\Phi\left(\dfrac{c-\dfrac{\mu-\mu_0}{\sigma/\sqrt{n}}}{1}\right)=\Phi\left(c-\dfrac{\mu-\mu_0}{\sigma/\sqrt{n}}\right), \mu \ge \mu_0$
  - 当取 $c=z1−α/2=−zαc=z_{1-\alpha/2}=-z_\alpha$ 时，犯第 II 类错误的概率最小，此时拒绝域 $W={Z=X‾−μ0σ/n≤−zα}W=\left\{Z=\dfrac{\overline{X}-\mu_0}{\sigma/\sqrt{n}} \leq -z_\alpha\right\}$
  - $P−=sup⁡μ≥μ0P{Z≤z0}=P{Z≤z0∣μ=μ0}=Φ(z0)P_-=\displaystyle\sup_{\mu \ge \mu_0}{P\{Z \leq z_0\}}=P\{Z \leq z_0 | \mu=\mu_0\}=\Phi(z_0)$ ，当 $P_-$ 值小于等于显著水平 $α\alpha$ 时拒绝原假设
- 考虑右侧假设 $H0:μ≤μ0,H1:μ>μ0H_0:\mu \leq \mu_0,H_1:\mu>\mu_0$ ，取检验统计量为 $Z=X‾−μ0σ/nZ=\dfrac{\overline{X}-\mu_0}{\sigma/\sqrt{n}}$ ，类似得到拒绝域 $W={Z=X‾−μ0σ/n≥zα}W=\left\{Z=\dfrac{\overline{X}-\mu_0}{\sigma/\sqrt{n}} \ge z_\alpha\right\}$
  - $P−=sup⁡μ≤μ0P{Z≥z0}=P{Z≥z0∣μ=μ0}=1−Φ(z0)P_-=\displaystyle\sup_{\mu \leq \mu_0}{P\{Z \ge z_0\}}=P\{Z \ge z_0 | \mu=\mu_0\}=1-\Phi(z_0)$ ，当 $P_-$ 值小于等于显著水平 $α\alpha$ 时拒绝原假设
均值 $μ\mu$ 的假设检验（ $σ2\sigma^2$ 未知），称为 $t$ 检验：
- 利用样本方差 $S^2$ 代替总体方差 $σ2\sigma^2$ ，取检验统计量 $T=X‾−μ0S/n∼t(n−1)T=\dfrac{\overline{X}-\mu_0}{S/\sqrt{n}} \sim t(n-1)$ ，对给定样本值 $x1,x2,…,xnx_1,x_2,\dots,x_n$ ，检验统计量 $T$ 的取值 $t0=x‾−μ0σ/nt_0=\dfrac{\overline{x}-\mu_0}{\sigma/\sqrt{n}}$
- 考虑双侧假设 $H0:μ=μ0,H1:μ≠μ0H_0:\mu=\mu_0,H_1:\mu \ne \mu_0$ ，拒绝域 $W={∣T∣=∣X‾−μ0S/n∣≥tα/2(n−1)}W=\left\{|T|=\left|\dfrac{\overline{X}-\mu_0}{S/\sqrt{n}}\right| \ge t_{\alpha/2}(n-1)\right\}$ ， $P−=2PH0{t(n−1)≥∣t0∣}P_-=2P_{H_0}\{t(n-1) \ge |t_0|\}$
- 考虑左侧假设 $H0:μ≥μ0,H1:μ<μ0H_0:\mu \ge \mu_0,H_1:\mu<\mu_0$ ，拒绝域 $W={T=X‾−μ0S/n≤−tα(n−1)}W=\left\{T=\dfrac{\overline{X}-\mu_0}{S/\sqrt{n}} \leq -t_{\alpha}(n-1)\right\}$ ， $P−=sup⁡μ≥μ0P{T≤t0}=P{t(n−1)≤t0}P_-=\displaystyle\sup_{\mu \ge \mu_0}{P\{T \leq t_0\}}=P\{t(n-1) \leq t_0\}$
- 考虑右侧假设 $H0:μ≤μ0,H1:μ>μ0H_0:\mu \leq \mu_0,H_1:\mu>\mu_0$ ，拒绝域 $W={T=X‾−μ0S/n≥tα(n−1)}W=\left\{T=\dfrac{\overline{X}-\mu_0}{S/\sqrt{n}} \ge t_{\alpha}(n-1)\right\}$ ， $P−=sup⁡μ≤μ0P{T≥t0}=P{t(n−1)≥t0}P_-=\displaystyle\sup_{\mu \leq \mu_0}{P\{T \ge t_0\}}=P\{t(n-1) \ge t_0\}$
方差 $σ2\sigma^2$ 的假设检验，称为 $χ2\chi^2$ 检验：
- 利用 $σ2\sigma^2$ 的无偏估计 $S2=1n−1∑i=1n(Xi−X‾)2S^2=\dfrac{1}{n-1}\displaystyle\sum_{i=1}^n{(X_i-\overline{X})^2}$ ，有 $(n−1)S2σ2∼χ2(n−1)\dfrac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)$ ，取检验统计量 $χ2=(n−1)S2σ02\chi^2=\dfrac{(n-1)S^2}{\sigma_0^2}$ ，代入样本值后的检验统计量 $χ02=(n−1)s2σ02\chi_0^2=\dfrac{(n-1)s^2}{\sigma_0^2}$ ，记 $p0=PH0{χ2(n−1)≤χ02}p_0=P_{H_0}\{\chi^2(n-1) \leq \chi_0^2\}$
- 考虑双侧假设 $H0:σ2=σ02,H1:σ2≠σ02H_0:\sigma^2=\sigma_0^2,H_1:\sigma^2 \ne \sigma_0^2$ ，拒绝域 $W={χ2≥χα/22(n−1)}∪{χ2≤χ1−α/22(n−1)}W=\{\chi^2 \ge \chi_{\alpha/2}^2(n-1)\} \cup \{\chi^2 \leq \chi_{1-\alpha/2}^2(n-1)\}$ ， $P−=2min⁡(p0,1−p0)P_-=2\displaystyle\min(p_0,1-p_0)$
- 考虑左侧假设 $H0:σ2≥σ02,H1:σ2<σ02H_0:\sigma^2 \ge \sigma_0^2,H_1:\sigma^2<\sigma_0^2$ ，拒绝域 $W={χ2≤χ1−α2(n−1)}W=\{\chi^2 \leq \chi_{1-\alpha}^2(n-1)\}$ ， $P_-=p_0$
- 考虑右侧假设 $H0:σ2≤σ02,H1:σ2>σ02H_0:\sigma^2 \leq \sigma_0^2,H_1:\sigma^2>\sigma_0^2$ ，拒绝域 $W={χ2≥χα2(n−1)}W=\{\chi^2 \ge \chi_{\alpha}^2(n-1)\}$ ， $P_-=1-p_0$

两个正态总体参数的假设检验

均值差 $μ1−μ2\mu_1-\mu_2$ 的假设检验（ $σ12\sigma_1^2$ 和 $σ22\sigma_2^2$ 已知）：
- 检验统计量 $X‾−Y‾∼N(μ1−μ2,σ12n1+σ22n2)\overline{X}-\overline{Y} \sim N\left(\mu_1-\mu_2, \dfrac{\sigma_1^2}{n_1}+\dfrac{\sigma_2^2}{n_2}\right)$
- 考虑双侧假设 $H0:μ1=μ2,H1:μ1≠μ2H_0:\mu_1=\mu_2, H_1:\mu_1 \ne \mu_2$ ，当 $H_0$ 成立时 $X‾−Y‾∼N(0,σ12n1+σ22n2)\overline{X}-\overline{Y} \sim N\left(0, \dfrac{\sigma_1^2}{n_1}+\dfrac{\sigma_2^2}{n_2}\right)$ ，利用 $Z$ 检验，得到拒绝域 $W={∣X‾−Y‾∣σ12n1+σ22n2≥zα/2}W=\left\{\dfrac{|\overline{X}-\overline{Y}|}{\sqrt{\dfrac{\sigma_1^2}{n_1}+\dfrac{\sigma_2^2}{n_2}}} \ge z_{\alpha/2}\right\}$ ， $P−=PH0{∣Z∣≥∣z0∣}=2PH0{Z≥∣z0∣}=2−2Φ(∣z0∣)P_-=P_{H_0}\{|Z| \ge |z_0|\}=2P_{H_0}\{Z \ge |z_0|\}=2-2\Phi(|z_0|)$
均值差 $μ1−μ2\mu_1-\mu_2$ 的假设检验（ $σ12=σ22=σ2\sigma_1^2=\sigma_2^2=\sigma^2$ 但未知），称为两样本精确 $t$ 检验：
- 采用 $σ2\sigma^2$ 的无偏估计 $Sw2=(n1−1)S12+(n2−1)S22n1+n2−2S_w^2=\dfrac{(n_1-1)S_1^2+(n_2-1)S_2^2}{n_1+n_2-2}$
- 考虑双侧假设 $H0:μ1=μ2,H1:μ1≠μ2H_0:\mu_1=\mu_2, H_1:\mu_1 \ne \mu_2$ ，取检验统计量 $T=X‾−Y‾Sw1n1+1n2T=\dfrac{\overline{X}-\overline{Y}}{S_w\sqrt{\dfrac{1}{n_1}+\dfrac{1}{n_2}}}$ ，当 $H_0$ 成立时 $\sim t(n_1+n_2-2)$ ，得到拒绝域 $W={∣T∣≥tα/2(n1+n2−2)}W=\{|T| \ge t_{\alpha/2}(n_1+n_2-2)\}$ ， $P−=PH0{∣T∣≥∣t0∣}=2PH0{t(n1+n2−2)≥∣t0∣}P_-=P_{H_0}\{|T| \ge |t_0|\}=2P_{H_0}\{t(n_1+n_2-2) \ge |t_0|\}$
方差比 $σ12σ22\dfrac{\sigma_1^2}{\sigma_2^2}$ 的假设检验：
- 取检验统计量 $F=S12S22F=\dfrac{S_1^2}{S_2^2}$ ，记代入样本值后的检验统计量 $f0=s12s22f_0=\dfrac{s_1^2}{s_2^2}$ ，设 $p0=PH0{F≤f0}=P{F(n1−1,n2−1)≤f0}p_0=P_{H_0}\{F \leq f_0\}=P\{F(n_1-1,n_2-1) \leq f_0\}$
- 考虑双侧假设 $H0:σ12=σ22,H1:σ12≠σ22H_0:\sigma_1^2=\sigma_2^2, H_1:\sigma_1^2 \ne \sigma_2^2$ ，当 $H_0$ 成立时 $\sim F(n_1-1,n_2-1)$ ，得到拒绝域 $W={F≥Fα/2(n1−1,n2−1)}∪{F≤F1−α/2(n1−1,n2−1)}W=\{F \ge F_{\alpha/2}(n_1-1,n_2-1)\} \cup \{F \leq F_{1-\alpha/2}(n_1-1,n_2-1)\}$ ， $P−=2min⁡(p0,1−p0)P_-=2\displaystyle\min(p_0, 1-p_0)$
- 考虑左侧假设 $H0:σ12≥σ22,H1:σ12<σ22H_0:\sigma_1^2 \ge \sigma_2^2, H_1:\sigma_1^2<\sigma_2^2$ ， $P_-=p_0$
- 考虑右侧侧假设 $H0:σ12≤σ22,H1:σ12>σ22H_0:\sigma_1^2 \leq \sigma_2^2, H_1:\sigma_1^2>\sigma_2^2$ ， $P_-=1-p_0$