概率论与数理统计复习

概率论的基本概念

事件频率

  • 对任一事件 A A A 0 ≤ f n ( A ) ≤ 1 0 \leq f_n(A) \leq 1 0fn(A)1
  • f n ( S ) = 1 f_n(S)=1 fn(S)=1
  • 当事件 A A A 和事件 B B B 不相容时, f n ( A ∪ B ) = f n ( A ) + f n ( B ) f_n(A \cup B)=f_n(A)+f_n(B) fn(AB)=fn(A)+fn(B)
  • 推广: f n ( ⋃ j = 1 k A j ) = ∑ j = 1 k f n ( A j ) f_n\left(\displaystyle\bigcup_{j=1}^k{A_j}\right)=\displaystyle\sum_{j=1}^k{f_n(A_j)} fn(j=1kAj)=j=1kfn(Aj)

概率公理

  • 非负性: P ( A ) ≥ 0 P(A) \ge 0 P(A)0
  • 规范性: P ( S ) = 1 P(S)=1 P(S)=1
  • 可列可加性:对 S S S 中的可列个两两不相容事件 A 1 , A 2 , … , A n , … A_1,A_2,\dots,A_n,\dots A1,A2,,An,,有 P ( ⋃ j = 1 + ∞ A j ) = ∑ j = 1 + ∞ P ( A j ) P\left(\displaystyle\bigcup_{j=1}^{+\infty}{A_j}\right)=\displaystyle\sum_{j=1}^{+\infty}{P(A_j)} P(j=1+Aj)=j=1+P(Aj)

概率性质

  • 对于有限个两两不相容的事件的和事件,有 P ( ⋃ j = 1 n A j ) = ∑ j = 1 n P ( A j ) P\left(\displaystyle\bigcup_{j=1}^n{A_j}\right)=\displaystyle\sum_{j=1}^n{P(A_j)} P(j=1nAj)=j=1nP(Aj)
  • P ( A ˉ ) = 1 − P ( A ) P(\bar{A})=1-P(A) P(Aˉ)=1P(A)
  • B ⊂ A B \subset A BA 时, P ( A − B ) = P ( A ) − P ( B ) P(A-B)=P(A)-P(B) P(AB)=P(A)P(B),从而 P ( A ) ≥ P ( B ) P(A) \ge P(B) P(A)P(B)
     证明: A = B ∪ A B ˉ ⇒ ∵ B ∩ A B ˉ = ∅ P ( A ) = P ( B ) + P ( A B ˉ ) = P ( B ) + P ( A − B ) A=B \cup A\bar{B} \xRightarrow{\because B \cap A\bar{B}=\varnothing} P(A)=P(B)+P(A\bar{B})=P(B)+P(A-B) A=BABˉBABˉ= P(A)=P(B)+P(ABˉ)=P(B)+P(AB)
    ∴ P ( A − B ) = P ( A ) − P ( B ) ⇒ ∵ P ( A − B ) ≥ 0 P ( A ) ≥ P ( B ) \therefore P(A-B)=P(A)-P(B) \xRightarrow{\because P(A-B) \ge 0} P(A) \ge P(B) P(AB)=P(A)P(B)P(AB)0 P(A)P(B)
  • 一般情况下: P ( A − B ) = P ( A ) − P ( A B ) P(A-B)=P(A)-P(AB) P(AB)=P(A)P(AB)
  • 概率加法公式: P ( A ∪ B ) = P ( A ) + P ( B ) − P ( A B ) P(A \cup B)=P(A)+P(B)-P(AB) P(AB)=P(A)+P(B)P(AB)
     证明: { A = A ∩ ( B ∪ B ˉ ) = A B ∪ A B ˉ ⇒ ∵ A B ∩ A B ˉ = ∅ P ( A ) = P ( A B ) + P ( A B ˉ ) A ∪ B = B ∪ A B ˉ ⇒ ∵ B ∩ A B ˉ = ∅ P ( A ∪ B ) = P ( B ) + P ( A B ˉ ) \begin{cases}A=A \cap (B \cup \bar{B})=AB \cup A\bar{B} \xRightarrow{\because AB \cap A\bar{B}=\varnothing} P(A)=P(AB)+P(A\bar{B}) \\ A \cup B=B \cup A\bar{B} \xRightarrow{\because B \cap A\bar{B}=\varnothing} P(A \cup B)=P(B)+P(A\bar{B})\end{cases} {A=A(BBˉ)=ABABˉABABˉ= P(A)=P(AB)+P(ABˉ)AB=BABˉBABˉ= P(AB)=P(B)+P(ABˉ)
    ∴ P ( A ∪ B ) = P ( A ) + P ( B ) − P ( A B ) \therefore P(A \cup B)=P(A)+P(B)-P(AB) P(AB)=P(A)+P(B)P(AB)
  • 推广: P ( ⋃ j = 1 n A j ) = ∑ j = 1 n P ( A j ) − ∑ i < j P ( A i A j ) + ∑ i < j < k P ( A i A j A k ) − ⋯ + ( − 1 ) n − 1 P ( A 1 A 2 ⋯ A n ) P\left(\displaystyle\bigcup_{j=1}^n{A_j}\right)=\displaystyle\sum_{j=1}^n{P(A_j)}-\displaystyle\sum_{i<j}{P(A_iA_j)}+\displaystyle\sum_{i<j<k}{P(A_iA_jA_k)}- \cdots +(-1)^{n-1}P(A_1A_2 \cdots A_n) P(j=1nAj)=j=1nP(Aj)i<jP(AiAj)+i<j<kP(AiAjAk)+(1)n1P(A1A2An)

条件概率

  • 如果 P ( B ) > 0 P(B)>0 P(B)>0,那么在 B B B 发生的条件下 A A A 发生的条件概率为 P ( A ∣ B ) = P ( A B ) P ( B ) P(A|B)=\dfrac{P(AB)}{P(B)} P(AB)=P(B)P(AB)
  • P ( C ) ≠ 0 P(C) \ne 0 P(C)=0 时,有:
    • P ( A ∣ C ) ≥ 0 P(A|C) \ge 0 P(AC)0
    • P ( S ∣ C ) = 1 P(S|C)=1 P(SC)=1
    • P ( B ∣ C ) = 1 − P ( B ˉ ∣ C ) P(B|C)=1-P(\bar{B}|C) P(BC)=1P(BˉC)
    • A ⊃ B A \supset B AB 时, P ( A ∣ C ) ≥ P ( B ∣ C ) P(A|C) \ge P(B|C) P(AC)P(BC)
    • P ( A ∪ B ∣ C ) = P ( A ∣ C ) + P ( B ∣ C ) − P ( A B ∣ C ) P(A \cup B|C)=P(A|C)+P(B|C)-P(AB|C) P(ABC)=P(AC)+P(BC)P(ABC)
    • 特别地,若 A B = ∅ AB=\varnothing AB=,则 P ( A ∪ B ∣ C ) = P ( A ∣ C ) + P ( B ∣ C ) P(A \cup B|C)=P(A|C)+P(B|C) P(ABC)=P(AC)+P(BC)
  • 乘法公式:当 P ( A ) ≠ 0 P(A) \ne 0 P(A)=0 P ( B ) ≠ 0 P(B) \ne 0 P(B)=0 时, P ( A B ) = P ( A ) ⋅ P ( B ∣ A ) = P ( B ) ⋅ P ( A ∣ B ) P(AB)=P(A) \cdot P(B|A)=P(B) \cdot P(A|B) P(AB)=P(A)P(BA)=P(B)P(AB)
  • 全概率公式:设 S S S 为某一试验的样本空间, A A A 为该试验的事件,设 B 1 , B 2 , … , B n B_1,B_2,\dots,B_n B1,B2,,Bn S S S 的一个划分,且 P ( B j ) > 0 P(B_j)>0 P(Bj)>0,则 P ( A ) = ∑ j = 1 n P ( B j ) P ( A ∣ B j ) P(A)=\displaystyle\sum_{j=1}^n{P(B_j)P(A|B_j)} P(A)=j=1nP(Bj)P(ABj)
     证明: A = A S = A ∩ ( ⋃ j = 1 n B j ) = ⋃ j = 1 n A B j ⇒ ∵ P ( A B j ) = P ( B j ) ⋅ P ( A ∣ B j ) P ( A ) ∑ j = 1 n P ( B j ) P ( A ∣ B j ) A=AS=A \cap \left(\displaystyle\bigcup_{j=1}^n{B_j}\right)=\displaystyle\bigcup_{j=1}^n{AB_j} \xRightarrow{\because P(AB_j)=P(B_j) \cdot P(A|B_j)} P(A)\displaystyle\sum_{j=1}^n{P(B_j)P(A|B_j)} A=AS=A(j=1nBj)=j=1nABjP(ABj)=P(Bj)P(ABj) P(A)j=1nP(Bj)P(ABj)
  • 贝叶斯公式:设 S S S 为某一试验的样本空间, A A A 为该试验的事件且 P ( A ) ≠ 0 P(A) \ne 0 P(A)=0,设 B 1 , B 2 , … , B n B_1,B_2,\dots,B_n B1,B2,,Bn S S S 的一个划分,且 P ( B j ) > 0 P(B_j)>0 P(Bj)>0,则 P ( B k ∣ A ) = P ( B k A ) P ( A ) = P ( B k ) P ( A ∣ B k ) ∑ j = 1 n P ( B j ) P ( A ∣ B j ) P(B_k|A)=\dfrac{P(B_kA)}{P(A)}=\dfrac{P(B_k)P(A|B_k)}{\displaystyle\sum_{j=1}^n{P(B_j)P(A|B_j)}} P(BkA)=P(A)P(BkA)=j=1nP(Bj)P(ABj)P(Bk)P(ABk)

事件的独立性

  • A A A B B B 为两随机事件,当 P ( A B ) = P ( A ) ⋅ P ( B ) P(AB)=P(A) \cdot P(B) P(AB)=P(A)P(B) 时称事件 A A A 和事件 B B B 相互独立
  • P ( A ) ⋅ P ( B ) ≠ 0 P(A) \cdot P(B) \ne 0 P(A)P(B)=0 时,“事件 A A A 和事件 B B B 相互独立”等价于条件概率等于无条件概率,即 P ( B ∣ A ) = P ( B ) P(B|A)=P(B) P(BA)=P(B) P ( A ∣ B ) = P ( A ) P(A|B)=P(A) P(AB)=P(A)
  • 当事件 A A A 和事件 B B B 相互独立时, A A A B ˉ \bar{B} Bˉ A ˉ \bar{A} Aˉ B B B A ˉ \bar{A} Aˉ B ˉ \bar{B} Bˉ 均相互独立
  • A , B , C A,B,C A,B,C 为三个随机事件,当 { P ( A B ) = P ( A ) P ( B ) P ( B C ) = P ( B ) P ( C ) P ( C A ) = P ( C ) P ( A ) \begin{cases} P(AB)=P(A)P(B) \\ P(BC)=P(B)P(C) \\ P(CA)=P(C)P(A) \end{cases} P(AB)=P(A)P(B)P(BC)=P(B)P(C)P(CA)=P(C)P(A) 都成立时,称事件 A , B , C A,B,C A,B,C 两两独立;如果还满足 P ( A B C ) = P ( A ) P ( B ) P ( C ) P(ABC)=P(A)P(B)P(C) P(ABC)=P(A)P(B)P(C),则称事件 A , B , C A,B,C A,B,C 相互独立
  • n n n 个事件 A 1 , A 2 , … , A n ( n ≥ 2 ) A_1,A_2,\dots,A_n (n \ge 2) A1,A2,,An(n2) 的任一子排列 A i 1 , A i 2 , … , A i k ( 2 ≤ k ≤ n ) A_{i_1},A_{i_2},\dots,A_{i_k} (2 \leq k \leq n) Ai1,Ai2,,Aik(2kn) 都满足 P ( A i 1 A i 2 ⋯ A i k ) = ∏ j = 1 k P ( A i j ) P(A_{i_1}A_{i_2} \cdots A_{i_k})=\displaystyle\prod_{j=1}^k{P(A_{i_j})} P(Ai1Ai2Aik)=j=1kP(Aij),则称事件 A 1 , A 2 , … , A n A_1,A_2,\dots,A_n A1,A2,,An 相互独立

随机变量及其概率分布

二项分布

  • 若随机变量 X X X 的概率分布律为 P { X = k } = C n k ( 1 − p ) n − k p k   ( k ∈ N ) P\{X=k\}=C_n^k(1-p)^{n-k}p^k \ (k \in \mathbb{N}) P{X=k}=Cnk(1p)nkpk (kN),其中 0 < p < 1 0<p<1 0<p<1 n ≥ 1 n \ge 1 n1,则称 X X X 服从参数为 ( n , p ) (n,p) (n,p) 的二项分布,记作 X ∼ B ( n , p ) X \sim B(n,p) XB(n,p)

泊松分布

  • 若随机变量 X X X 的概率分布律为 P { X = k } = e − λ ⋅ λ k k !   ( k ∈ N ) P\{X=k\}=e^{-\lambda} \cdot \dfrac{\lambda^k}{k!} \ (k \in \mathbb{N}) P{X=k}=eλk!λk (kN),其中 λ > 0 \lambda>0 λ>0,则称 X X X 服从参数为 λ \lambda λ 的泊松分布,记作 X ∼ P ( λ ) X \sim P(\lambda) XP(λ)
  • n n n 足够大、 p p p 足够小时,可以用泊松分布 P ( n p ) P(np) P(np) 近似估计二项分布 B ( n , p ) B(n,p) B(n,p)

随机变量的分布函数

  • F ( x ) = P { X ≤ x } = ∑ x i ≤ x P { X = x i }    o r    ∫ − ∞ x P { X = x } d x F(x)=P\{X \leq x\}=\displaystyle\sum_{x_i \leq x}{P\{X=x_i\}} \ \ \mathrm{or} \ \ \displaystyle\int_{-\infty}^x{P\{X=x\}\mathrm{d}x} F(x)=P{Xx}=xixP{X=xi}  or  xP{X=x}dx
  • P { x 1 < X ≤ x 2 } = P { X ≤ x 2 } − P { X ≤ x 1 } = F ( x 2 ) − F ( x 1 ) P\{x_1<X \leq x_2\}=P\{X \leq x_2\}-P\{X \leq x_1\}=F(x_2)-F(x_1) P{x1<Xx2}=P{Xx2}P{Xx1}=F(x2)F(x1)
  • 分布函数的性质:
    • F ( x ) F(x) F(x) 单调不减
    • 0 ≤ F ( x ) ≤ 1 0 \leq F(x) \leq 1 0F(x)1,且满足 lim ⁡ a → − ∞ F ( a ) = 0 \displaystyle\lim_{a \to -\infty}{F(a)}=0 alimF(a)=0 lim ⁡ b → + ∞ F ( b ) = 1 \displaystyle\lim_{b \to +\infty}{F(b)}=1 b+limF(b)=1
    • F ( x + 0 ) = F ( x ) F(x+0)=F(x) F(x+0)=F(x),即 F ( x ) F(x) F(x) 右连续

连续型随机变量的密度函数

  • 对于随机变量 X X X,其分布函数为 F ( x ) F(x) F(x),若存在一个非负的实函数 f ( x ) f(x) f(x),使得对任意实数 x x x,有 F ( x ) = ∫ − ∞ x f ( t ) d t F(x)=\displaystyle\int_{-\infty}^x{f(t)\mathrm{d}t} F(x)=xf(t)dt,则称 f ( x ) f(x) f(x) 为连续型随机变量 X X X 的密度函数
  • 密度函数的性质:
    • f ( x ) ≥ 0 f(x) \ge 0 f(x)0
    • ∫ − ∞ + ∞ f ( t ) d t = 1 \displaystyle\int_{-\infty}^{+\infty}{f(t)\mathrm{d}t}=1 +f(t)dt=1
    • 对于任意实数 x 1 < x 2 x_1<x_2 x1<x2,有 P { x 1 < X ≤ x 2 } = F ( x 2 ) − F ( x 1 ) = ∫ x 1 x 2 f ( t ) d t P\{x_1<X \leq x_2\}=F(x_2)-F(x_1)=\displaystyle\int_{x_1}^{x_2}{f(t)\mathrm{d}t} P{x1<Xx2}=F(x2)F(x1)=x1x2f(t)dt
    • f ( x ) f(x) f(x) x = x 0 x=x_0 x=x0 处连续,则 F ′ ( x ) = f ( x ) F'(x)=f(x) F(x)=f(x)
  • F ( x ) F(x) F(x) 的连续性可以推出 P { X = a } = 0 P\{X=a\}=0 P{X=a}=0,即连续型随机变量取任一定值的概率为零

均匀分布

  • 设随机变量 X X X 具有密度函数 f ( x ) = { 1 b − a , x ∈ ( a , b ) 0 , o t h e r w i s e f(x)=\begin{cases}\dfrac{1}{b-a}, x \in (a,b) \\ 0, otherwise\end{cases} f(x)=ba1,x(a,b)0,otherwise,则称 X X X 服从区间 ( a , b ) (a,b) (a,b) 上的均匀分布,记作 X ∼ U ( a , b ) X \sim U(a,b) XU(a,b)
  • 均匀分布的分布函数: F ( x ) = { 0 , x < a x − a b − a , a ≤ x < b 1 , x ≥ b F(x)=\begin{cases}0, &x<a \\ \dfrac{x-a}{b-a}, &a \leq x<b \\ 1, &x \ge b\end{cases} F(x)=0,baxa,1,x<aax<bxb

正态分布

  • 设随机变量 X X X 具有密度函数 f ( x ) = 1 2 π σ exp ⁡ [ − ( x − μ ) 2 2 σ 2 ] f(x)=\dfrac{1}{\sqrt{2\pi}\sigma}\exp\left[-\dfrac{(x-\mu)^2}{2\sigma^2}\right] f(x)=2π σ1exp[2σ2(xμ)2],其中 σ > 0 \sigma>0 σ>0 ∣ μ ∣ < + ∞ |\mu|<+\infty μ<+,则称 X X X 服从参数为 ( μ , σ ) (\mu,\sigma) (μ,σ) 的正态分布,记作 X ∼ N ( μ , σ 2 ) X \sim N(\mu,\sigma^2) XN(μ,σ2)
  • 正态分布密度函数的性质:
    • f ( x ) f(x) f(x) 关于 x = μ x=\mu x=μ 对称
    • max ⁡ ∣ x ∣ < + ∞ f ( x ) = f ( μ ) = 1 2 π σ \displaystyle\max_{|x|<+\infty}{f(x)}=f(\mu)=\dfrac{1}{\sqrt{2\pi}\sigma} x<+maxf(x)=f(μ)=2π σ1
    • lim ⁡ ∣ x − μ ∣ → + ∞ f ( x ) = 0 \displaystyle\lim_{|x-\mu| \to +\infty}{f(x)}=0 xμ+limf(x)=0
  • 标准正态分布 Z ∼ N ( 0 , 1 ) Z \sim N(0,1) ZN(0,1),密度函数 φ ( x ) = 1 2 π exp ⁡ ( − x 2 2 ) \varphi(x)=\dfrac{1}{\sqrt{2\pi}}\exp\left(-\dfrac{x^2}{2}\right) φ(x)=2π 1exp(2x2),分布函数 Φ ( x ) = 1 2 π exp ⁡ ( − x 2 2 ) \Phi(x)=\dfrac{1}{\sqrt{2\pi}}\exp\left(-\dfrac{x^2}{2}\right) Φ(x)=2π 1exp(2x2)
    • 根据对称性, Φ ( − x ) = P { Z ≤ − x } = P { Z ≥ x } = 1 − Φ ( x ) \Phi(-x)=P\{Z \leq -x\}=P\{Z \ge x\}=1-\Phi(x) Φ(x)=P{Zx}=P{Zx}=1Φ(x)
    • 对于一般正态分布 X ∼ N ( μ , σ 2 ) X \sim N(\mu,\sigma^2) XN(μ,σ2) P { a < X < b } = Φ ( b − μ σ ) − Φ ( a − μ σ ) P\{a<X<b\}=\Phi\left(\dfrac{b-\mu}{\sigma}\right)-\Phi\left(\dfrac{a-\mu}{\sigma}\right) P{a<X<b}=Φ(σbμ)Φ(σaμ)
    • z α z_\alpha zα 满足 Φ ( z α ) = 1 − α \Phi(z_\alpha)=1-\alpha Φ(zα)=1α,称 z α z_\alpha zα 为标准正态分布的上 α \alpha α 分位数

指数分布

  • 设随机变量 X X X 具有密度函数 f ( x ) = { λ e − λ x , x > 0 0 , x ≤ 0 f(x)=\begin{cases}\lambda e^{-\lambda x}, &x>0 \\ 0, &x \leq 0\end{cases} f(x)={λeλx,0,x>0x0,其中 λ > 0 \lambda>0 λ>0,则称 X X X 服从参数为 λ \lambda λ 的指数分布,记作 X ∼ E ( λ ) X \sim E(\lambda) XE(λ)
  • 指数分布的分布函数: F ( x ) = { 1 − e − λ x , x > 0 0 , x ≤ 0 F(x)=\begin{cases}1-e^{-\lambda x}, &x>0 \\ 0, &x \leq 0\end{cases} F(x)={1eλx,0,x>0x0
  • 指数分布具有无记忆性: P { X > t 0 + t } = P { X > t 0 } ⋅ P { X > t } P\{X>t_0+t\}=P\{X>t_0\} \cdot P\{X>t\} P{X>t0+t}=P{X>t0}P{X>t}

随机变量函数的分布

  • X X X 为一连续型随机变量,其密度函数为 f X ( x ) f_X(x) fX(x),随机变量 Y = g ( X ) Y=g(X) Y=g(X)。若函数 y = g ( x ) y=g(x) y=g(x) 为一严格单调递增(或单调递减)函数,且处处可微,记其反函数为 x = h ( y ) x=h(y) x=h(y),则 Y Y Y 的密度函数为 f Y ( y ) = { f X ( h ( y ) ) ⋅ ∣ h ′ ( y ) ∣ , y ∈ D 0 , y ∉ D f_Y(y)=\begin{cases}f_X(h(y)) \cdot |h'(y)|, &y \in D \\ 0, &y \not\in D\end{cases} fY(y)={fX(h(y))h(y),0,yDyD,其中 D D D 为函数 y = g ( x ) y=g(x) y=g(x) 的值域

多元随机变量及其分布

二元离散型随机变量

  • 设二元离散型随机变量 ( X , Y ) (X,Y) (X,Y) 的可能取值为 ( x i , y j ) (x_i,y_j) (xi,yj),其中 i , j ∈ N + i,j \in \mathbb{N}^+ i,jN+,称 P { X = x i , Y = y j } = p i j P\{X=x_i, Y=y_j\}=p_{ij} P{X=xi,Y=yj}=pij ( X , Y ) (X,Y) (X,Y) 的联合分布律
  • 二元离散型随机变量的边际分布:
    • P { X = x i } = P ( ⋃ j = 1 + ∞ { X = x i , Y = y j } ) = ∑ j = 1 + ∞ p i j ≜ p i ⋅ P\{X=x_i\}=P\left(\displaystyle\bigcup_{j=1}^{+\infty}{\{X=x_i, Y=y_j\}}\right)=\displaystyle\sum_{j=1}^{+\infty}{p_{ij}} \triangleq p_{i \cdot} P{X=xi}=P(j=1+{X=xi,Y=yj})=j=1+pijpi
    • P { Y = y j } = P ( ⋃ i = 1 + ∞ { X = x i , Y = y j } ) = ∑ i = 1 + ∞ p i j ≜ p ⋅ j P\{Y=y_j\}=P\left(\displaystyle\bigcup_{i=1}^{+\infty}{\{X=x_i, Y=y_j\}}\right)=\displaystyle\sum_{i=1}^{+\infty}{p_{ij}} \triangleq p_{\cdot j} P{Y=yj}=P(i=1+{X=xi,Y=yj})=i=1+pijpj
  • 二元离散型随机变量的条件分布:
    • P { X = x i ∣ Y = y j } = P { X = x i , Y = y j } P { Y = y j } = p i j p ⋅ j P\{X=x_i|Y=y_j\}=\dfrac{P\{X=x_i, Y=y_j\}}{P\{Y=y_j\}}=\dfrac{p_{ij}}{p_{\cdot j}} P{X=xiY=yj}=P{Y=yj}P{X=xi,Y=yj}=pjpij
    • P { Y = y j ∣ X = x i } = P { X = x i , Y = y j } P { X = x i } = p i j p i ⋅ P\{Y=y_j|X=x_i\}=\dfrac{P\{X=x_i, Y=y_j\}}{P\{X=x_i\}}=\dfrac{p_{ij}}{p_{i \cdot}} P{Y=yjX=xi}=P{X=xi}P{X=xi,Y=yj}=pipij

二元随机变量的分布函数

  • 二元随机变量的联合分布函数:设二元随机变量 ( X , Y ) (X,Y) (X,Y),对于任意实数 x , y x, y x,y,称函数 F ( x , y ) = P { X ≤ x , Y ≤ y } F(x,y)=P\{X \leq x, Y \leq y\} F(x,y)=P{Xx,Yy} ( X , Y ) (X,Y) (X,Y) 的联合分布函数
  • 二元联合分布函数的性质:
    • 对于固定的 x = x 0 x=x_0 x=x0 F ( x 0 , y ) F(x_0, y) F(x0,y) 关于 y y y 单调不减
    • 对于固定的 y = y 0 y=y_0 y=y0 F ( x , y 0 ) F(x, y_0) F(x,y0) 关于 x x x 单调不减
    • 0 ≤ F ( x , y ) ≤ 1 0 \leq F(x,y) \leq 1 0F(x,y)1
    • F ( x , − ∞ ) = F ( − ∞ , y ) = F ( − ∞ , − ∞ ) = 0 , F ( + ∞ , + ∞ ) = 1 F(x, -\infty)=F(-\infty, y)=F(-\infty, -\infty)=0, F(+\infty, +\infty)=1 F(x,)=F(,y)=F(,)=0,F(+,+)=1
    • F ( x + 0 , y ) = F ( x , y ) F(x+0, y)=F(x, y) F(x+0,y)=F(x,y),即 F ( x , y ) F(x,y) F(x,y) 关于 x x x 右连续
    • F ( x , y + 0 ) = F ( x , y ) F(x, y+0)=F(x, y) F(x,y+0)=F(x,y),即 F ( x , y ) F(x,y) F(x,y) 关于 y y y 右连续
    • 对于实数 x 1 < x 2 x_1<x_2 x1<x2 y 1 < y 2 y_1<y_2 y1<y2 P { x 1 < X ≤ x 2 , y 1 < Y ≤ y 2 } = F ( x 2 , y 2 ) − F ( x 1 , y 2 ) − F ( x 2 , y 1 ) + F ( x 1 , y 1 ) P\{x_1<X \leq x_2, y_1<Y \leq y_2\}=F(x_2,y_2)-F(x_1,y_2)-F(x_2,y_1)+F(x_1,y_1) P{x1<Xx2,y1<Yy2}=F(x2,y2)F(x1,y2)F(x2,y1)+F(x1,y1)
  • 二元边际分布函数:
    • F X ( x ) = P { X ≤ x } = P { X ≤ x , Y ≤ + ∞ } = F ( x , + ∞ ) F_X(x)=P\{X \leq x\}=P\{X \leq x, Y \leq +\infty\}=F(x, +\infty) FX(x)=P{Xx}=P{Xx,Y+}=F(x,+)
    • F Y ( y ) = P { Y ≤ y } = P { X ≤ + ∞ , Y ≤ y } = F ( + ∞ , y ) F_Y(y)=P\{Y \leq y\}=P\{X \leq +\infty, Y \leq y\}=F(+\infty, y) FY(y)=P{Yy}=P{X+,Yy}=F(+,y)
  • 二元条件分布函数: F Y ∣ X ( y ∣ x i ) = P { Y ≤ y ∣ X = x i }    o r    lim ⁡ δ → 0 + P { Y ≤ y ∣ x i < X ≤ x i + δ } F_{Y|X}(y|x_i)=P\{Y \leq y|X=x_i\} \ \ \mathrm{or} \ \ \displaystyle\lim_{\delta \to 0^+}{P\{Y \leq y|x_i<X \leq x_i+\delta\}} FYX(yxi)=P{YyX=xi}  or  δ0+limP{Yyxi<Xxi+δ}

二元连续型随机变量

  • 设二元随机变量 ( X , Y ) (X,Y) (X,Y) 的联合分布函数为 F ( x , y ) F(x,y) F(x,y),若存在二元函数 f ( x , y ) ≥ 0 f(x,y) \ge 0 f(x,y)0,对任意实数 x , y x,y x,y F ( x , y ) = ∫ − ∞ x ∫ − ∞ y f ( u , v ) d u d v F(x,y)=\displaystyle\int_{-\infty}^x\displaystyle\int_{-\infty}^y{f(u,v)\mathrm{d}u\mathrm{d}v} F(x,y)=xyf(u,v)dudv,则称 f ( x , y ) f(x,y) f(x,y) ( X , Y ) (X,Y) (X,Y) 的联合密度函数
  • 联合密度函数的性质:
    • f ( x , y ) ≥ 0 f(x,y) \ge 0 f(x,y)0
    • ∫ − ∞ + ∞ ∫ − ∞ + ∞ f ( u , v ) d u d v = F ( + ∞ , + ∞ ) = 1 \displaystyle\int_{-\infty}^{+\infty}\displaystyle\int_{-\infty}^{+\infty}{f(u,v)\mathrm{d}u\mathrm{d}v}=F(+\infty,+\infty)=1 ++f(u,v)dudv=F(+,+)=1
    • F ( x , y ) F(x,y) F(x,y) ( x , y ) (x,y) (x,y) 处连续,则 ∂ 2 F ( x , y ) ∂ x ∂ y = f ( x , y ) \dfrac{\partial^2 F(x,y)}{\partial x \partial y}=f(x,y) xy2F(x,y)=f(x,y)
    • ( X , Y ) (X,Y) (X,Y) 落入 x O y xOy xOy 平面任一区域 D D D 的概率为 P { ( X , Y ) ∈ D } = ∬ D f ( x , y ) d x d y P\{(X,Y) \in D\}=\displaystyle\iint_D{f(x,y)\mathrm{d}x\mathrm{d}y} P{(X,Y)D}=Df(x,y)dxdy
  • 二元连续型随机变量的边际分布:
    • F X ( x ) = P { X ≤ x } = P { X ≤ x , Y ≤ + ∞ } = ∫ − ∞ x [ ∫ − ∞ + ∞ f ( x , y ) d y ] d x F_X(x)=P\{X \leq x\}=P\{X \leq x, Y \leq +\infty\}=\displaystyle\int_{-\infty}^{x}{\left[\displaystyle\int_{-\infty}^{+\infty}{f(x,y)\mathrm{d}y}\right]\mathrm{d}x} FX(x)=P{Xx}=P{Xx,Y+}=x[+f(x,y)dy]dx
    • f X ( x ) = ∫ − ∞ + ∞ f ( x , y ) d y f_X(x)=\displaystyle\int_{-\infty}^{+\infty}{f(x,y)\mathrm{d}y} fX(x)=+f(x,y)dy
    • F Y ( y ) = P { Y ≤ y } = P { X ≤ + ∞ , Y ≤ y } = ∫ − ∞ y [ ∫ − ∞ + ∞ f ( x , y ) d x ] d y F_Y(y)=P\{Y \leq y\}=P\{X \leq +\infty, Y \leq y\}=\displaystyle\int_{-\infty}^{y}{\left[\displaystyle\int_{-\infty}^{+\infty}{f(x,y)\mathrm{d}x}\right]\mathrm{d}y} FY(y)=P{Yy}=P{X+,Yy}=y[+f(x,y)dx]dy
    • f Y ( y ) = ∫ − ∞ + ∞ f ( x , y ) d x f_Y(y)=\displaystyle\int_{-\infty}^{+\infty}{f(x,y)\mathrm{d}x} fY(y)=+f(x,y)dx
  • 条件密度函数:
    • f Y ∣ X ( y ∣ x ) = f ( x , y ) f X ( x ) , f X ( x ) ≠ 0 f_{Y|X}(y|x)=\dfrac{f(x,y)}{f_X(x)}, f_X(x) \ne 0 fYX(yx)=fX(x)f(x,y),fX(x)=0
    • f X ∣ Y ( x ∣ y ) = f ( x , y ) f Y ( y ) , f Y ( y ) ≠ 0 f_{X|Y}(x|y)=\dfrac{f(x,y)}{f_Y(y)}, f_Y(y) \ne 0 fXY(xy)=fY(y)f(x,y),fY(y)=0
  • 设二元随机变量 ( X , Y ) (X,Y) (X,Y) 具有联合密度函数 f ( x , y ) = 1 2 π σ 1 σ 2 1 − ρ 2 exp ⁡ { − 1 2 ( 1 − ρ 2 ) [ ( x − μ 1 ) 2 σ 1 2 − 2 ρ ( x − μ 1 ) ( y − μ 2 ) σ 1 σ 2 + ( y − μ 2 ) 2 σ 2 2 ] } f(x,y)=\dfrac{1}{2\pi\sigma_1\sigma_2\sqrt{1-\rho^2}}\exp\left\{-\dfrac{1}{2(1-\rho^2)}\left[\dfrac{(x-\mu_1)^2}{\sigma_1^2}-2\rho\dfrac{(x-\mu_1)(y-\mu_2)}{\sigma_1\sigma_2}+\dfrac{(y-\mu_2)^2}{\sigma_2^2}\right]\right\} f(x,y)=2πσ1σ21ρ2 1exp{2(1ρ2)1[σ12(xμ1)22ρσ1σ2(xμ1)(yμ2)+σ22(yμ2)2]},其中 ∣ μ 1 ∣ , ∣ μ 2 ∣ < + ∞ |\mu_1|,|\mu_2|<+\infty μ1,μ2<+ σ 1 , σ 2 > 0 \sigma_1,\sigma_2>0 σ1,σ2>0 ∣ ρ ∣ < 1 |\rho|<1 ρ<1,则称 ( X , Y ) (X,Y) (X,Y) 服从参数为 ( μ 1 , μ 2 , σ 1 2 , σ 2 2 , ρ ) (\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,\rho) (μ1,μ2,σ12,σ22,ρ) 的二元正态分布,记为 ( X , Y ) ∼ N ( μ 1 , μ 2 , σ 1 2 , σ 2 2 , ρ ) (X,Y) \sim N(\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,\rho) (X,Y)N(μ1,μ2,σ12,σ22,ρ)
    • X , Y X,Y X,Y 的边际分布也是正态分布: X ∼ N ( μ 1 , σ 1 2 ) , Y ∼ N ( μ 2 , σ 2 2 ) X \sim N(\mu_1,\sigma_1^2), Y \sim N(\mu_2,\sigma_2^2) XN(μ1,σ12),YN(μ2,σ22)
    • 当给定 { X = x } \{X=x\} {X=x} 的条件下, Y Y Y 的条件分布也是正态分布: Y ∣ X = x ∼ N ( μ 2 + ρ σ 1 σ 2 ( x − μ 1 ) , ( 1 − ρ 2 ) σ 2 2 ) Y|X=x \sim N\left(\mu_2+\rho\dfrac{\sigma_1}{\sigma_2}(x-\mu_1),(1-\rho^2)\sigma_2^2\right) YX=xN(μ2+ρσ2σ1(xμ1),(1ρ2)σ22)
    • 当给定 { Y = y } \{Y=y\} {Y=y} 的条件下, X X X 的条件分布也是正态分布: X ∣ Y = y ∼ N ( μ 1 + ρ σ 1 σ 2 ( y − μ 2 ) , ( 1 − ρ 2 ) σ 1 2 ) X|Y=y \sim N\left(\mu_1+\rho\dfrac{\sigma_1}{\sigma_2}(y-\mu_2),(1-\rho^2)\sigma_1^2\right) XY=yN(μ1+ρσ2σ1(yμ2),(1ρ2)σ12)

随机变量的独立性

  • 对于任意两个实数集合 D 1 , D 2 D_1,D2 D1,D2,若 P { X ∈ D 1 , Y ∈ D 2 } = P { X ∈ D 1 } ⋅ P { Y ∈ D 2 } P\{X \in D_1,Y \in D_2\}=P\{X \in D_1\} \cdot P\{Y \in D_2\} P{XD1,YD2}=P{XD1}P{YD2},则称随机变量 X , Y X,Y X,Y 相互独立
  • F ( x , y ) = F X ( x ) ⋅ F Y ( y ) F(x,y)=F_X(x) \cdot F_Y(y) F(x,y)=FX(x)FY(y) 时, X , Y X,Y X,Y 相互独立
  • 对于连续型随机变量,被积的密度函数在除了面积为零的区域外处处相等,即 f ( x , y ) = f X ( x ) ⋅ f Y ( y ) f(x,y)=f_X(x) \cdot f_Y(y) f(x,y)=fX(x)fY(y),为相互独立的等价定义
  • 二元连续型随机变量 X , Y X,Y X,Y 相互独立的充要条件是 X , Y X,Y X,Y 的联合密度函数 f ( x , y ) f(x,y) f(x,y) 几乎处处可写成关于 x x x 的函数 m ( x ) m(x) m(x) 和关于 y y y 的函数 n ( y ) n(y) n(y),即 f ( x , y ) = m ( x ) ⋅ n ( y ) , ∣ x ∣ < + ∞ , ∣ y ∣ < + ∞ , f ( x , y ) ≠ 0 f(x,y)=m(x) \cdot n(y), |x|<+\infty, |y|<+\infty, f(x,y) \ne 0 f(x,y)=m(x)n(y),x<+,y<+,f(x,y)=0

二元随机变量函数的分布

  • Z = X + Y Z=X+Y Z=X+Y
    • f Z ( z ) = ∫ − ∞ + ∞ f ( x , z − x ) d x f_Z(z)=\displaystyle\int_{-\infty}^{+\infty}{f(x,z-x)\mathrm{d}x} fZ(z)=+f(x,zx)dx
    • f Z ( z ) = ∫ − ∞ + ∞ f ( z − y , y ) d y f_Z(z)=\displaystyle\int_{-\infty}^{+\infty}{f(z-y,y)\mathrm{d}y} fZ(z)=+f(zy,y)dy
  • M = max ⁡ ( X , Y ) M=\max(X,Y) M=max(X,Y)
    • F M ( t ) = P { max ⁡ ( X , Y ) ≤ t } = P { X ≤ t , Y ≤ t } = F ( t , t ) F_M(t)=P\{\max(X,Y) \leq t\}=P\{X \leq t, Y \leq t\}=F(t,t) FM(t)=P{max(X,Y)t}=P{Xt,Yt}=F(t,t)
    • X , Y X,Y X,Y 相互独立,则 F M ( t ) = F x ( t ) ⋅ F Y ( t ) F_M(t)=F_x(t) \cdot F_Y(t) FM(t)=Fx(t)FY(t)
  • N = min ⁡ ( X , Y ) N=\min(X,Y) N=min(X,Y)
    • F N ( t ) = P { min ⁡ ( X , Y ) ≤ t } = 1 − P { min ⁡ ( X , Y ) > t } = 1 − P { X > t , Y > t } F_N(t)=P\{\min(X,Y) \leq t\}=1-P\{\min(X,Y)>t\}=1-P\{X>t, Y>t\} FN(t)=P{min(X,Y)t}=1P{min(X,Y)>t}=1P{X>t,Y>t}
    • X , Y X,Y X,Y 相互独立,则 F N ( t ) = 1 − [ 1 − F X ( t ) ] ⋅ [ 1 − F Y ( t ) ] F_N(t)=1-[1-F_X(t)] \cdot [1-F_Y(t)] FN(t)=1[1FX(t)][1FY(t)]

随机变量的数字特征

期望

  • E ( X ) = ∑ i = 1 + ∞ x i p i    o r    ∫ − ∞ + ∞ x f ( x ) d x E(X)=\displaystyle\sum_{i=1}^{+\infty}{x_ip_i} \ \ \mathrm{or} \ \ \displaystyle\int_{-\infty}^{+\infty}{xf(x)\mathrm{d}x} E(X)=i=1+xipi  or  +xf(x)dx
    • 泊松分布的期望: E ( X ) = ∑ k = 0 + ∞ k ⋅ ( e − λ ⋅ λ k k ! ) = λ e − λ ∑ k = 1 + ∞ λ k − 1 ( k − 1 ) ! = λ e − λ ⋅ e λ = λ E(X)=\displaystyle\sum_{k=0}^{+\infty}{k \cdot \left(e^{-\lambda} \cdot \dfrac{\lambda^k}{k!}\right)}=\lambda e^{-\lambda}\displaystyle\sum_{k=1}^{+\infty}{\dfrac{\lambda^{k-1}}{(k-1)!}}=\lambda e^{-\lambda} \cdot e^{\lambda}=\lambda E(X)=k=0+k(eλk!λk)=λeλk=1+(k1)!λk1=λeλeλ=λ
    • 指数分布的期望: E ( X ) = ∫ 0 + ∞ x ⋅ λ e − λ x ⋅ d x = x ⋅ ( − e − λ x ) ∣ 0 + ∞ − ∫ 0 + ∞ − e − λ x d x = − 1 λ e − λ x ∣ 0 + ∞ = 1 λ E(X)=\displaystyle\int_0^{+\infty}{x \cdot \lambda e^{-\lambda x} \cdot \mathrm{d}x}=\left.x \cdot (-e^{-\lambda x})\right|_0^{+\infty}-\displaystyle\int_0^{+\infty}{-e^{-\lambda x}\mathrm{d}x}=\left.-\dfrac1\lambda e^{-\lambda x}\right|_0^{+\infty}=\dfrac1\lambda E(X)=0+xλeλxdx=x(eλx)0+0+eλxdx=λ1eλx0+=λ1
    • 标准正态分布的期望: E ( Z ) = ∫ − ∞ + ∞ z ⋅ φ ( z ) d z = ∵ f ( − z ) = − z φ ( z ) = − f ( z ) 0 E(Z)=\displaystyle\int_{-\infty}^{+\infty}{z \cdot \varphi(z)\mathrm{d}z} \xlongequal{\because f(-z)=-z\varphi(z)=-f(z)} 0 E(Z)=+zφ(z)dzf(z)=zφ(z)=f(z) 0
  • 随机变量函数的期望: E ( g ( X ) ) = ∑ i = 1 + ∞ g ( x i ) p i    o r    ∫ − ∞ + ∞ g ( x ) f ( x ) d x E(g(X))=\displaystyle\sum_{i=1}^{+\infty}{g(x_i)p_i} \ \ \mathrm{or} \ \ \displaystyle\int_{-\infty}^{+\infty}{g(x)f(x)\mathrm{d}x} E(g(X))=i=1+g(xi)pi  or  +g(x)f(x)dx
  • 二元随机变量函数的期望: E ( h ( X , Y ) ) = ∑ i = 1 + ∞ ∑ j = 1 + ∞ h ( x i , y i ) p i j    o r    ∫ − ∞ + ∞ ∫ − ∞ + ∞ h ( x , y ) f ( x , y ) d x d y E(h(X,Y))=\displaystyle\sum_{i=1}^{+\infty}\displaystyle\sum_{j=1}^{+\infty}{h(x_i, y_i)p_{ij}} \ \ \mathrm{or} \ \ \displaystyle\int_{-\infty}^{+\infty}\displaystyle\int_{-\infty}^{+\infty}{h(x,y)f(x,y)\mathrm{d}x\mathrm{d}y} E(h(X,Y))=i=1+j=1+h(xi,yi)pij  or  ++h(x,y)f(x,y)dxdy
  • 期望的性质: E ( c 0 + ∑ i = 1 n c i X i ) = c 0 + ∑ i = 1 n c i E ( X i ) E\left(c_0+\displaystyle\sum_{i=1}^{n}{c_iX_i}\right)=c_0+\displaystyle\sum_{i=1}^{n}{c_iE(X_i)} E(c0+i=1nciXi)=c0+i=1nciE(Xi)
    • 正态分布的期望: X ∼ N ( μ , σ 2 ) ⇒ Z = X − μ σ ∼ N ( 0 , 1 ) E ( X ) = E ( σ Z + μ ) = σ E ( Z ) + μ = μ X \sim N(\mu, \sigma^2) \xRightarrow{Z=\frac{X-\mu}{\sigma} \sim N(0,1)} E(X)=E(\sigma Z+\mu)=\sigma E(Z)+\mu=\mu XN(μ,σ2)Z=σXμN(0,1) E(X)=E(σZ+μ)=σE(Z)+μ=μ
    • 二项分布的期望: E ( X ) = E ( ∑ i = 1 n X i ) = ∑ i = 1 n E ( X i ) = ∑ i = 1 n p = n p E(X)=E\left(\displaystyle\sum_{i=1}^{n}{X_i}\right)=\displaystyle\sum_{i=1}^{n}{E(X_i)}=\displaystyle\sum_{i=1}^{n}{p}=np E(X)=E(i=1nXi)=i=1nE(Xi)=i=1np=np
  • 对于独立变量: E ( ∏ i = 1 n X i ) = ∏ i = 1 n E ( X i ) E\left(\displaystyle\prod_{i=1}^{n}{X_i}\right)=\displaystyle\prod_{i=1}^{n}{E(X_i)} E(i=1nXi)=i=1nE(Xi)

方差

  • V a r ( X ) = D ( X ) = E [ ( X − E ( X ) ) 2 ] \mathrm{Var}(X)=D(X)=E[(X-E(X))^2] Var(X)=D(X)=E[(XE(X))2]
    • 标准差: σ ( X ) = D ( X ) \sigma(X)=\sqrt{D(X)} σ(X)=D(X)
    • D ( X ) = E [ X 2 − 2 X ⋅ E ( X ) + E 2 ( X ) ] = E ( X 2 ) − E ( X ) ⋅ 2 E ( X ) + E 2 ( X ) = E ( X 2 ) − E 2 ( X ) D(X)=E[X^2-2X \cdot E(X)+E^2(X)]=E(X^2)-E(X) \cdot 2E(X)+E^2(X)=E(X^2)-E^2(X) D(X)=E[X22XE(X)+E2(X)]=E(X2)E(X)2E(X)+E2(X)=E(X2)E2(X)
    • 泊松分布的方差: E ( X 2 ) = ∑ k = 0 + ∞ k 2 ⋅ ( e − λ ⋅ λ k k ! ) = λ e − λ ∑ k = 1 + ∞ [ ( k − 1 ) + 1 ] ⋅ λ k − 1 ( k − 1 ) ! = λ e − λ [ λ ∑ k = 2 + ∞ λ k − 2 ( k − 2 ) ! + ∑ k = 1 + ∞ λ k − 1 ( k − 1 ) ! ] = λ e − λ ( λ e λ + e λ ) = λ 2 + λ ⇒ E ( X ) = λ D ( X ) = λ E(X^2)=\displaystyle\sum_{k=0}^{+\infty}{k^2 \cdot \left(e^{-\lambda} \cdot \dfrac{\lambda^k}{k!}\right)}=\lambda e^{-\lambda}\displaystyle\sum_{k=1}^{+\infty}{[(k-1)+1] \cdot \dfrac{\lambda^{k-1}}{(k-1)!}}=\lambda e^{-\lambda}\left[\lambda\displaystyle\sum_{k=2}^{+\infty}{\dfrac{\lambda^{k-2}}{(k-2)!}}+\displaystyle\sum_{k=1}^{+\infty}{\dfrac{\lambda^{k-1}}{(k-1)!}}\right]=\lambda e^{-\lambda}\left(\lambda e^{\lambda}+e^{\lambda}\right)=\lambda^2+\lambda \xRightarrow{E(X)=\lambda} D(X)=\lambda E(X2)=k=0+k2(eλk!λk)=λeλk=1+[(k1)+1](k1)!λk1=λeλ[λk=2+(k2)!λk2+k=1+(k1)!λk1]=λeλ(λeλ+eλ)=λ2+λE(X)=λ D(X)=λ
    • 指数分布的方差: E ( X 2 ) = ∫ 0 + ∞ x 2 ⋅ λ e − λ x ⋅ d x = x 2 ⋅ ( − e − λ x ) ∣ 0 + ∞ − ∫ 0 + ∞ 2 x ⋅ ( − e − λ x ) d x = 2 ∫ 0 + ∞ x e − λ x d x = 2 λ E ( X ) ⇒ E ( X ) = 1 λ D ( X ) = 1 λ 2 E(X^2)=\displaystyle\int_0^{+\infty}{x^2 \cdot \lambda e^{-\lambda x} \cdot \mathrm{d}x}=\left.x^2 \cdot (-e^{-\lambda x})\right|_0^{+\infty}-\displaystyle\int_0^{+\infty}{2x \cdot (-e^{-\lambda x})\mathrm{d}x}=2\displaystyle\int_0^{+\infty}{xe^{-\lambda x}\mathrm{d}x}=\dfrac2\lambda E(X) \xRightarrow{E(X)=\frac1\lambda} D(X)=\dfrac1{\lambda^2} E(X2)=0+x2λeλxdx=x2(eλx)0+0+2x(eλx)dx=20+xeλxdx=λ2E(X)E(X)=λ1 D(X)=λ21
    • 标准正态分布的方差: D ( X ) = 1 D(X)=1 D(X)=1
  • 方差的性质: D ( c 0 + ∑ i = 1 n c i X i ) = ∑ i = 1 n c i 2 D ( X i ) D\left(c_0+\displaystyle\sum_{i=1}^{n}{c_iX_i}\right)=\displaystyle\sum_{i=1}^{n}{c_i^2D(X_i)} D(c0+i=1nciXi)=i=1nci2D(Xi)
    • 二项分布的方差: D ( X ) = D ( ∑ i = 1 n X i ) = ∑ i = 1 n D ( X i ) = ∑ i = 1 n p ( 1 − p ) = n p ( 1 − p ) D(X)=D\left(\displaystyle\sum_{i=1}^{n}{X_i}\right)=\displaystyle\sum_{i=1}^{n}{D(X_i)}=\displaystyle\sum_{i=1}^{n}{p(1-p)}=np(1-p) D(X)=D(i=1nXi)=i=1nD(Xi)=i=1np(1p)=np(1p)

协方差

  • C o v ( X , Y ) = E [ ( X − E ( X ) ) ( Y − E ( Y ) ) ] = E ( X Y ) − E ( X ) E ( Y ) \mathrm{Cov}(X,Y)=E[(X-E(X))(Y-E(Y))]=E(XY)-E(X)E(Y) Cov(X,Y)=E[(XE(X))(YE(Y))]=E(XY)E(X)E(Y)
    • 离散型: C o v ( X , Y ) = ∑ i = 1 + ∞ ∑ j = 1 + ∞ ( x i − E ( X ) ) ( y j − E ( Y ) ) p i j \mathrm{Cov}(X,Y)=\displaystyle\sum_{i=1}^{+\infty}\displaystyle\sum_{j=1}^{+\infty}{(x_i-E(X))(y_j-E(Y))p_{ij}} Cov(X,Y)=i=1+j=1+(xiE(X))(yjE(Y))pij
    • 连续型: C o v ( X , Y ) = ∫ − ∞ + ∞ ∫ − ∞ + ∞ ( x − E ( X ) ) ( y − E ( Y ) ) f ( x , y ) d x d y \mathrm{Cov}(X,Y)=\displaystyle\int_{-\infty}^{+\infty}\displaystyle\int_{-\infty}^{+\infty}{(x-E(X))(y-E(Y))f(x,y)\mathrm{d}x\mathrm{d}y} Cov(X,Y)=++(xE(X))(yE(Y))f(x,y)dxdy
  • X 1 , X 2 , … , X n X_1,X_2,\dots,X_n X1,X2,,Xn 为方差存在的随机变量,则 V a r ( ∑ i = 1 n X i ) = ∑ i = 1 n V a r ( X i ) + 2 ∑ 1 ≤ i < j ≤ n C o v ( X i , X j ) \mathrm{Var}\left(\displaystyle\sum_{i=1}^n{X_i}\right)=\displaystyle\sum_{i=1}^n{\mathrm{Var}(X_i)}+2\displaystyle\sum_{1 \leq i<j \leq n}{\mathrm{Cov}(X_i, X_j)} Var(i=1nXi)=i=1nVar(Xi)+21i<jnCov(Xi,Xj)
  • 协方差的性质:
    • C o v ( X , Y ) = C o v ( Y , X ) \mathrm{Cov}(X, Y)=\mathrm{Cov}(Y, X) Cov(X,Y)=Cov(Y,X)
    • C o v ( X , X ) = V a r ( X ) \mathrm{Cov}(X, X)=\mathrm{Var}(X) Cov(X,X)=Var(X)
    • C o v ( a X , b Y ) = a b C o v ( X , Y ) \mathrm{Cov}(aX, bY)=ab\mathrm{Cov}(X, Y) Cov(aX,bY)=abCov(X,Y)
    • C o v ( X i , Y ) \mathrm{Cov}(X_i, Y) Cov(Xi,Y) 存在,则 C o v ( X 1 + X 2 , Y ) = C o v ( X 1 , Y ) + C o v ( X 2 , Y ) \mathrm{Cov}(X_1+X_2, Y)=\mathrm{Cov}(X_1, Y)+\mathrm{Cov}(X_2, Y) Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y)
    • X , Y X,Y X,Y 相互独立,则 C o v ( X , Y ) = 0 \mathrm{Cov}(X,Y)=0 Cov(X,Y)=0,但反之不然
    • V a r ( X ) ⋅ V a r ( Y ) ≠ 0 \mathrm{Var}(X) \cdot \mathrm{Var}(Y) \ne 0 Var(X)Var(Y)=0 时,有 V a r 2 ( X , Y ) ≤ V a r ( X ) ⋅ V a r ( Y ) \mathrm{Var}^2(X,Y) \leq \mathrm{Var}(X) \cdot \mathrm{Var}(Y) Var2(X,Y)Var(X)Var(Y),等号成立当且仅当 X , Y X,Y X,Y 之间有严格的线性关系,即存在常数 c 1 , c 2 c_1,c_2 c1,c2 使得 P { Y = c 1 + c 2 X } = 1 P\{Y=c_1+c_2X\}=1 P{Y=c1+c2X}=1

相关系数

  • 对于随机变量 X , Y X,Y X,Y,当 E ( X 2 ) , E ( Y 2 ) E(X^2),E(Y^2) E(X2),E(Y2) 均存在,且 V a r ( X ) , V a r ( Y ) ≠ 0 \mathrm{Var}(X),\mathrm{Var}(Y) \ne 0 Var(X),Var(Y)=0 时,称 ρ X Y = C o v ( X , Y ) V a r ( X ) V a r ( Y ) \rho_{XY}=\dfrac{\mathrm{Cov}(X,Y)}{\sqrt{\mathrm{Var}(X)}\sqrt{\mathrm{Var}(Y)}} ρXY=Var(X) Var(Y) Cov(X,Y)
    • 标准化定义: ρ X Y = C o v ( X ∗ , Y ∗ ) \rho_{XY}=\mathrm{Cov}(X^*,Y^*) ρXY=Cov(X,Y),其中 X ∗ = X − E ( X ) D ( X ) , Y ∗ = Y − E ( Y ) D ( Y ) X^*=\dfrac{X-E(X)}{\sqrt{D(X)}},Y^*=\dfrac{Y-E(Y)}{\sqrt{D(Y)}} X=D(X) XE(X),Y=D(Y) YE(Y)
  • 相关系数的性质:
    • X , Y X,Y X,Y 相互独立,则 ρ X Y = 0 \rho_{XY}=0 ρXY=0,但反之不然
    • ∣ ρ X Y ∣ ≤ 1 |\rho_{XY}| \leq 1 ρXY1,等号成立当且仅当 X , Y X,Y X,Y 之间有严格的线性关系,即存在常数 c 1 , c 2 c_1,c_2 c1,c2 使得 P { Y = c 1 + c 2 X } = 1 P\{Y=c_1+c_2X\}=1 P{Y=c1+c2X}=1
  • 当随机变量 X , Y X,Y X,Y 的相关系数 ρ X Y = 0 \rho_{XY}=0 ρXY=0 时,称 X , Y X,Y X,Y 不相关,等价定义:
    • C o v ( X , Y ) = 0 \mathrm{Cov}(X,Y)=0 Cov(X,Y)=0
    • E ( X Y ) = E ( X ) E ( Y ) E(XY)=E(X)E(Y) E(XY)=E(X)E(Y)
    • D ( X + Y ) = D ( X ) + D ( Y ) D(X+Y)=D(X)+D(Y) D(X+Y)=D(X)+D(Y)

α \alpha α 分位数

  • 设连续型随机变量的分布函数 F ( x ) F(x) F(x) 和密度函数 f ( x ) f(x) f(x),对任意 0 < α < 1 0<\alpha<1 0<α<1,称满足条件 1 − F ( x α ) = ∫ x α + ∞ f ( x ) d x = α 1-F(x_\alpha)=\displaystyle\int_{x_\alpha}^{+\infty}{f(x)\mathrm{d}x}=\alpha 1F(xα)=xα+f(x)dx=α 的实数 x α x_\alpha xα 为随机变量 X X X 的上 α \alpha α 分位数
  • 由正态分布对称性, z 1 − α = − z α z_{1-\alpha}=-z_\alpha z1α=zα

协方差矩阵

  • n n n 元随机变量 X = ( X 1 , X 2 , ⋯   , X n ) T \bm{X}=(X_1,X_2,\cdots,X_n)^T X=(X1,X2,,Xn)T,若其每一分量的方差都存在,则称 C o v ( X ) = E [ ( X − E ( X ) ) ( X − E ( X ) ) T ] = [ C o v ( X i , X j ) ] n × n \mathrm{Cov}(\bm{X})=E[(\bm{X}-E(\bm{X}))(\bm{X}-E(\bm{X}))^T]=[\mathrm{Cov}(X_i,X_j)]_{n \times n} Cov(X)=E[(XE(X))(XE(X))T]=[Cov(Xi,Xj)]n×n n n n 元随机变量 X \bm{X} X 的协方差矩阵

  • n n n 元随机变量 X = ( X 1 , X 2 , ⋯   , X n ) T \bm{X}=(X_1,X_2,\cdots,X_n)^T X=(X1,X2,,Xn)T,它的每一分量的方差都存在,记 X \bm{X} X 的协方差矩阵为 B = C o v ( X ) \bm{B}=\mathrm{Cov}(\bm{X}) B=Cov(X),数学期望为 a = E ( X ) = ( E ( X 1 ) , E ( X 2 ) , … , E ( X n ) ) T \bm{a}=E(\bm{X})=(E(X_1),E(X_2),\dots,E(X_n))^T a=E(X)=(E(X1),E(X2),,E(Xn))T,则由密度函数 f ( x ) = 1 ( 2 π ) n ∣ B ∣ exp ⁡ [ − 1 2 ( x − a ) T B − 1 ( x − a ) ] f(\bm{x})=\dfrac{1}{\sqrt{(2\pi)^n|\bm{B}|}}\exp\left[-\dfrac12(\bm{x}-\bm{a})^T\bm{B}^{-1}(\bm{x}-\bm{a})\right] f(x)=(2π)nB 1exp[21(xa)TB1(xa)] 定义的分布为 n n n 元正态分布,常记为 X ∼ N ( a , B ) \bm{X} \sim N(\bm{a},\bm{B}) XN(a,B),其中 x = ( x 1 , x 2 , … , x n ) T \bm{x}=(x_1,x_2,\dots,x_n)^T x=(x1,x2,,xn)T ∣ B ∣ = det ⁡ B |\bm{B}|=\det\bm{B} B=detB

    • 二元正态分布的协方差矩阵: B = ( σ 1 2 σ 1 σ 2 ρ σ 2 σ 1 ρ σ 2 2 ) \bm{B}=\begin{pmatrix}\sigma_1^2 & \sigma_1\sigma_2\rho \\ \sigma_2\sigma_1\rho & \sigma_2^2\end{pmatrix} B=(σ12σ2σ1ρσ1σ2ρσ22)
    • n n n 元正态变量 ( X 1 , X 2 , ⋯   , X n ) T (X_1,X_2,\cdots,X_n)^T (X1,X2,,Xn)T 中的任意 k k k 元子向量 ( X i 1 , X i 2 , … , X i k ) T (X_{i_1},X_{i_2},\dots,X_{i_k})^T (Xi1,Xi2,,Xik)T 也服从 k k k 元正态分布;特别地, n n n 元正态变量的每一个分量都服从一元正态分布;反之,若 X i X_i Xi 都是相互独立的正态变量,则 ( X 1 , X 2 , ⋯   , X n ) T (X_1,X_2,\cdots,X_n)^T (X1,X2,,Xn)T 服从 n n n 元正态分布
    • X = ( X 1 , X 2 , ⋯   , X n ) T \bm{X}=(X_1,X_2,\cdots,X_n)^T X=(X1,X2,,Xn)T 服从 n n n 元正态分布的充要条件是任意关于分量的线性组合均服从一元正态分布,即对任意 n n n 元实向量 l = ( l 1 , l 2 , … , l n ) T \bm{l}=(l_1,l_2,\dots,l_n)^T l=(l1,l2,,ln)T,其中 ∣ l ∣ ≠ 0 |\bm{l}| \ne 0 l=0,有 X ∼ N ( a , B )    ⟺    l T B = ∑ i = 1 n l i X i ∼ N ( l T a , l T B l ) \bm{X} \sim N(\bm{a},\bm{B}) \iff \bm{l}^T\bm{B}=\displaystyle\sum_{i=1}^n{l_iX_i} \sim N(\bm{l}^T\bm{a},\bm{l}^T\bm{B}\bm{l}) XN(a,B)lTB=i=1nliXiN(lTa,lTBl)
    • 正态变量线性变换不变性:对于 n n n 元正态变量 X = ( X 1 , X 2 , ⋯   , X n ) T \bm{X}=(X_1,X_2,\cdots,X_n)^T X=(X1,X2,,Xn)T,若 Y 1 , Y 2 , … , Y k Y_1,Y_2,\dots,Y_k Y1,Y2,,Yk 都是 X 1 , X 2 , … , X n X_1,X_2,\dots,X_n X1,X2,,Xn 的线性函数,则 Y = ( Y 1 , Y 2 , … , Y k ) T \bm{Y}=(Y_1,Y_2,\dots,Y_k)^T Y=(Y1,Y2,,Yk)T 服从 k k k 元正态分布,用矩阵形式表述,若 X ∼ N ( a , B ) , C = [ c i j ] k × n \bm{X} \sim N(\bm{a},\bm{B}),\bm{C}=[c_{ij}]_{k \times n} XN(a,B),C=[cij]k×n,则 Y = C X ∼ N ( C a , C B C T ) \bm{Y}=\bm{C}\bm{X} \sim N(\bm{C}\bm{a},\bm{C}\bm{B}\bm{C}^T) Y=CXN(Ca,CBCT)

大数定律及中心极限定理

依概率收敛

  • { Y n , n ≥ 1 } \{Y_n, n\ge 1\} {Yn,n1} 为一随机变量序列, c c c 为一常数,若对任意的 ε > 0 \varepsilon>0 ε>0,都有 lim ⁡ n → + ∞ P { ∣ Y n − c ∣ ≥ ε } = 0 \displaystyle\lim_{n \to +\infty}{P\{|Y_n-c| \ge \varepsilon\}}=0 n+limP{Yncε}=0 成立,则称 { Y n , n ≥ 1 } \{Y_n, n\ge 1\} {Yn,n1} 依概率收敛于 c c c,记为 Y n → P c , n → + ∞ Y_n \xrightarrow{P} c, n \to +\infty YnP c,n+
    • 等价表示: lim ⁡ n → + ∞ P { ∣ Y n − c ∣ < ε } = 1 \displaystyle\lim_{n \to +\infty}{P\{|Y_n-c|<\varepsilon\}}=1 n+limP{Ync<ε}=1
  • X n → P a , Y n → P b , n → + ∞ X_n \xrightarrow{P} a, Y_n \xrightarrow{P} b, n \to +\infty XnP a,YnP b,n+,其中 a , b a,b a,b 为常数,若二元函数 g ( x , y ) g(x,y) g(x,y) 在点 ( a , b ) (a,b) (a,b) 处连续,则有 g ( X n , Y n ) → P g ( a , b ) , n → + ∞ g(X_n,Y_n) \xrightarrow{P} g(a,b), n \to +\infty g(Xn,Yn)P g(a,b),n+

马尔可夫(Markov)不等式

  • 若随机变量 Y Y Y k k k 阶(原点)矩存在,则对任意的 ε > 0 \varepsilon>0 ε>0,有 P { ∣ Y ∣ ≥ ε } ≤ E ( ∣ Y ∣ k ) ε k P\{|Y| \ge \varepsilon\} \leq \dfrac{E(|Y|^k)}{\varepsilon^k} P{Yε}εkE(Yk)
    • 证明:构造 Z = { ε , ∣ Y ∣ ≥ ε 0 , ∣ Y ∣ < ε Z=\begin{cases}\varepsilon, & |Y| \ge \varepsilon \\ 0, & |Y|<\varepsilon\end{cases} Z={ε,0,YεY<ε,则 Z k ≤ ∣ Y ∣ k Z^k \leq |Y|^k ZkYk,故 E ( Z k ) ≤ E ( ∣ Y ∣ k ) E(Z^k) \leq E(|Y|^k) E(Zk)E(Yk),注意到 E ( Z k ) = ε k ⋅ P { ∣ Y ∣ ≥ ε } E(Z^k)=\varepsilon^k \cdot P\{|Y| \ge \varepsilon\} E(Zk)=εkP{Yε},因此 P { ∣ Y ∣ ≥ ε } = E ( Z k ) ε k ≤ E ( ∣ Y ∣ k ) ε k P\{|Y| \ge \varepsilon\}=\dfrac{E(Z^k)}{\varepsilon^k} \leq \dfrac{E(|Y|^k)}{\varepsilon^k} P{Yε}=εkE(Zk)εkE(Yk)

切比雪夫(Chebyshev)不等式

  • 设随机变量 X X X 存在期望 μ \mu μ 和方差 σ 2 \sigma^2 σ2,则对任意的 ε > 0 \varepsilon>0 ε>0,有 P { ∣ X − μ ∣ ≥ ε } ≤ σ 2 ε 2 P\{|X-\mu| \ge \varepsilon\} \leq \dfrac{\sigma^2}{\varepsilon^2} P{Xμε}ε2σ2
    • 证明:取 Y = X − μ , k = 2 Y=X-\mu,k=2 Y=Xμ,k=2,利用马尔可夫不等式即可

弱大数定律

  • 设随机变量序列 { Y i , i ≥ 1 } \{Y_i, i \ge 1\} {Yi,i1},若存在常数序列 { c n , n ≥ 1 } \{c_n, n \ge 1\} {cn,n1},使得对任意的 ε > 0 \varepsilon>0 ε>0,有 lim ⁡ n → + ∞ P { ∣ 1 n ∑ i = 1 n Y i − c n ∣ ≥ ε } = 0 \displaystyle\lim_{n \to +\infty}{P\left\{\left|\dfrac1n\displaystyle\sum_{i=1}^n{Y_i}-c_n\right| \ge \varepsilon\right\}}=0 n+limP{n1i=1nYicnε}=0,则称 { Y i , i ≥ 1 } \{Y_i, i \ge 1\} {Yi,i1} 服从弱大数定律,记作 1 n ∑ i = 1 n Y i − c n → P 0 , n → + ∞ \dfrac1n\displaystyle\sum_{i=1}^n{Y_i}-c_n \xrightarrow{P} 0, n \to +\infty n1i=1nYicnP 0,n+
    • 特别地,当 c n ≡ c c_n \equiv c cnc 时,可记为 1 n ∑ i = 1 n Y i → P c , n → + ∞ \dfrac1n\displaystyle\sum_{i=1}^n{Y_i} \xrightarrow{P} c, n \to +\infty n1i=1nYiP c,n+

伯努利(Bernoulli)大数定律

  • n A n_A nA n n n 重伯努利试验中事件 A A A 发生的次数, p p p 为事件 A A A 发生的概率,则对任意的 ε > 0 \varepsilon>0 ε>0,有 lim ⁡ n → + ∞ P { ∣ n A n − p ∣ ≥ ε } = 0 \displaystyle\lim_{n \to +\infty}{P\left\{\left|\dfrac{n_A}{n}-p\right| \ge \varepsilon\right\}}=0 n+limP{nnApε}=0

辛钦(Khinchin)大数定律

  • { X i , i ≥ 1 } \{X_i, i \ge 1\} {Xi,i1} 为独立同分布的随机变量序列,且存在期望 μ \mu μ,则对任意的 ε > 0 \varepsilon>0 ε>0,有 lim ⁡ n → + ∞ P { ∣ 1 n ∑ i = 1 n X i − μ ∣ ≥ ε } = 0 \displaystyle\lim_{n \to +\infty}{P\left\{\left|\dfrac1n\displaystyle\sum_{i=1}^n{X_i}-\mu\right| \ge \varepsilon\right\}}=0 n+limP{n1i=1nXiμε}=0

林德伯格(Lindeberg)-莱维(Lévy)中心极限定理

  • { X i , i ≥ 1 } \{X_i, i \ge 1\} {Xi,i1} 为独立同分布的随机变量序列,且存在期望 E ( X i ) = μ E(X_i)=\mu E(Xi)=μ 和方差 D ( X i ) = σ 2 D(X_i)=\sigma^2 D(Xi)=σ2,则对任意的 x ∈ R x \in \mathbb{R} xR lim ⁡ n → + ∞ P { ∑ i = 1 n X i − E ( ∑ i = 1 n X i ) D ( ∑ i = 1 n X i ) ≤ x } = lim ⁡ n → + ∞ P { ∑ i = 1 n X i − n μ σ n ≤ x } = Φ ( x ) \displaystyle\lim_{n \to +\infty}{P\left\{\dfrac{\displaystyle\sum_{i=1}^n{X_i}-E\left(\displaystyle\sum_{i=1}^n{X_i}\right)}{\sqrt{D\left(\displaystyle\sum_{i=1}^n{X_i}\right)}} \leq x\right\}}=\displaystyle\lim_{n \to +\infty}{P\left\{\dfrac{\displaystyle\sum_{i=1}^n{X_i}-n\mu}{\sigma\sqrt{n}} \leq x\right\}}=\Phi(x) n+limPD(i=1nXi) i=1nXiE(i=1nXi)x=n+limPσn i=1nXinμx=Φ(x)
    • 推论:当 n n n 充分大时, ∑ i = 1 n X i − n μ σ n = 1 n ∑ i = 1 n X i − μ σ / n = X ‾ − μ σ / n ∼ N ( 0 , 1 ) \dfrac{\displaystyle\sum_{i=1}^n{X_i}-n\mu}{\sigma\sqrt{n}}=\dfrac{\dfrac1n\displaystyle\sum_{i=1}^n{X_i}-\mu}{\sigma/\sqrt{n}}=\dfrac{\overline{X}-\mu}{\sigma/\sqrt{n}} \sim N(0,1) σn i=1nXinμ=σ/n n1i=1nXiμ=σ/n XμN(0,1)

棣莫弗(De Moivre)-拉普拉斯(Laplace)中心极限定理

  • n A n_A nA n n n 重伯努利试验中事件 A A A 发生的次数, p p p 为事件 A A A 发生的概率,则对任意的 x ∈ R x \in \mathbb{R} xR,有 lim ⁡ n → + ∞ P { n A − n p n p ( 1 − p ) ≤ x } = Φ ( x ) \displaystyle\lim_{n \to +\infty}{P\left\{\dfrac{n_A-np}{\sqrt{np(1-p)}} \leq x\right\}}=\Phi(x) n+limP{np(1p) nAnpx}=Φ(x)

统计量与抽样分布

统计量

  • 样本均值 X ‾ = 1 n ∑ i = 1 n X i \overline{X}=\dfrac1n\displaystyle\sum_{i=1}^n{X_i} X=n1i=1nXi
  • 样本方差 S 2 = 1 n − 1 ∑ i = 1 n ( X i − X ‾ ) 2 = 1 n − 1 ( ∑ i = 1 n X i 2 − n X ‾ 2 ) S^2=\dfrac1{n-1}\displaystyle\sum_{i=1}^n{(X_i-\overline{X})^2}=\dfrac1{n-1}\left(\displaystyle\sum_{i=1}^n{X_i^2}-n\overline{X}^2\right) S2=n11i=1n(XiX)2=n11(i=1nXi2nX2)
  • 样本标准差 S = S 2 = 1 n − 1 ∑ i = 1 n ( X i − X ‾ ) 2 S=\sqrt{S^2}=\sqrt{\dfrac1{n-1}\displaystyle\sum_{i=1}^n{(X_i-\overline{X})^2}} S=S2 =n11i=1n(XiX)2
  • 样本 k k k 阶(原点)矩 A k = 1 n ∑ i = 1 n X i k , k ∈ N + A_k=\dfrac1n\displaystyle\sum_{i=1}^n{X_i^k}, k \in \mathbb{N}^+ Ak=n1i=1nXik,kN+
  • 样本 k k k 阶中心矩 B k = 1 n ∑ i = 1 n ( X i − X ‾ ) k , k ∈ N + B_k=\dfrac1n\displaystyle\sum_{i=1}^n{(X_i-\overline{X})^k}, k \in \mathbb{N}^+ Bk=n1i=1n(XiX)k,kN+

χ 2 \chi^2 χ2 分布

  • X 1 , X 2 , … , X n X_1,X_2,\dots,X_n X1,X2,,Xn 为独立同分布的随机变量,且都服从 N ( 0 , 1 ) N(0,1) N(0,1),令 Y = X 1 2 + X 2 2 + ⋯ + X n 2 Y=X_1^2+X_2^2+\cdots+X_n^2 Y=X12+X22++Xn2,则称 Y Y Y 服从自由度为 n n n χ 2 \chi^2 χ2 分布,记作 Y ∼ χ 2 ( n ) Y \sim \chi^2(n) Yχ2(n)
    • E ( χ 2 ( n ) ) = ∑ i = 1 n E ( X i 2 ) = ∑ i = 1 n [ E ( X i ) + D ( X i ) ] = n E(\chi^2(n))=\displaystyle\sum_{i=1}^n{E(X_i^2)}=\displaystyle\sum_{i=1}^n{[E(X_i)+D(X_i)]}=n E(χ2(n))=i=1nE(Xi2)=i=1n[E(Xi)+D(Xi)]=n
    • D ( χ 2 ( n ) ) = ∑ i = 1 n D ( X i 2 ) = ∑ i = 1 n [ E ( X i 4 ) − ( E ( X i 2 ) ) 2 ] = ∵ E ( Z 4 ) = 3 2 n D(\chi^2(n))=\displaystyle\sum_{i=1}^n{D(X_i^2)}=\displaystyle\sum_{i=1}^n{[E(X_i^4)-(E(X_i^2))^2]} \xlongequal{\because E(Z^4)=3} 2n D(χ2(n))=i=1nD(Xi2)=i=1n[E(Xi4)(E(Xi2))2]E(Z4)=3 2n

t t t 分布

  • X ∼ N ( 0 , 1 ) , Y ∼ χ 2 ( n ) X \sim N(0,1), Y \sim \chi^2(n) XN(0,1),Yχ2(n),且 X , Y X,Y X,Y 相互独立,则称随机变量 t = X Y / n t=\dfrac{X}{\sqrt{Y/n}} t=Y/n X 服从自由度为 n n n t t t 分布,记作 t ∼ t ( n ) t \sim t(n) tt(n)
    • t 1 − α ( n ) = − t α ( n ) t_{1-\alpha}(n)=-t_\alpha(n) t1α(n)=tα(n)

F F F 分布

  • U ∼ χ 2 ( n 1 ) , V ∼ χ 2 ( n 2 ) U \sim \chi^2(n_1), V \sim \chi^2(n_2) Uχ2(n1),Vχ2(n2),且 U , V U,V U,V 相互独立,则称随机变量 F = U / n 1 V / n 2 F=\dfrac{U/n_1}{V/n_2} F=V/n2U/n1 服从自由度为 ( n 1 , n 2 ) (n_1,n_2) (n1,n2) F F F 分布,记作 F ∼ F ( n 1 , n 2 ) F \sim F(n_1,n_2) FF(n1,n2)
    • F ∼ F ( n 1 , n 2 ) F \sim F(n_1,n_2) FF(n1,n2),则 1 F ∼ F ( n 2 , n 1 ) \dfrac1F \sim F(n_2,n_1) F1F(n2,n1)
    • X ∼ t ( n ) X \sim t(n) Xt(n),则 X 2 ∼ F ( 1 , n ) X^2 \sim F(1,n) X2F(1,n)
    • F 1 − α ( n 1 , n 2 ) = 1 F α ( n 2 , n 1 ) F_{1-\alpha}(n_1,n_2)=\dfrac{1}{F_\alpha(n_2,n_1)} F1α(n1,n2)=Fα(n2,n1)1

正态总体下的抽样分布

  • X 1 , X 2 , … , X n X_1,X_2,\dots,X_n X1,X2,,Xn 为来自正态总体 N ( μ , σ 2 ) N(\mu,\sigma^2) N(μ,σ2) 的简单随机样本,样本均值 X ‾ \overline{X} X,样本方差 S 2 S^2 S2,则有
    • X ‾ ∼ N ( μ , σ 2 n ) \overline{X} \sim N\left(\mu, \dfrac{\sigma^2}{n}\right) XN(μ,nσ2)
    • ( n − 1 ) S 2 σ 2 ∼ χ 2 ( n − 1 ) \dfrac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1) σ2(n1)S2χ2(n1)
    • X ‾ \overline{X} X S 2 S^2 S2 相互独立
    • X ‾ − μ S / n = X ‾ − μ σ 2 / n / ( n − 1 ) S 2 σ 2 ( n − 1 ) ∼ t ( n − 1 ) \dfrac{\overline{X}-\mu}{S/\sqrt{n}}=\left.\dfrac{\overline{X}-\mu}{\sqrt{\sigma^2/n}} \middle/ \sqrt{\dfrac{(n-1)S^2}{\sigma^2(n-1)}} \right.\sim t(n-1) S/n Xμ=σ2/n Xμ/σ2(n1)(n1)S2 t(n1)
  • X 1 , X 2 , … , X n 1 X_1,X_2,\dots,X_{n_1} X1,X2,,Xn1 Y 1 , Y 2 , … , Y n 2 Y_1,Y_2,\dots,Y_{n_2} Y1,Y2,,Yn2 分别为来自正态总体 N ( μ 1 , σ 1 2 ) N(\mu_1,\sigma_1^2) N(μ1,σ12) N ( μ 2 , σ 2 2 ) N(\mu_2,\sigma_2^2) N(μ2,σ22) 的简单随机样本,样本均值 X ‾ \overline{X} X Y ‾ \overline{Y} Y,样本方差 S 1 2 S_1^2 S12 S 2 2 S_2^2 S22,则有
    • S 1 2 / σ 1 2 S 2 2 / σ 2 2 = ( n 1 − 1 ) S 1 2 σ 1 2 / ( n 1 − 1 ) ( n 2 − 1 ) S 2 2 σ 2 2 / ( n 2 − 1 ) ∼ F ( n 1 − 1 , n 2 − 1 ) \dfrac{S_1^2/\sigma_1^2}{S_2^2/\sigma_2^2}=\dfrac{\left.\dfrac{(n_1-1)S_1^2}{\sigma_1^2} \middle/ (n_1-1)\right.}{\left.\dfrac{(n_2-1)S_2^2}{\sigma_2^2} \middle/ (n_2-1)\right.} \sim F(n_1-1,n_2-1) S22/σ22S12/σ12=σ22(n21)S22/(n21)σ12(n11)S12/(n11)F(n11,n21)
    • σ 1 2 = σ 2 2 = σ 2 \sigma_1^2=\sigma_2^2=\sigma^2 σ12=σ22=σ2 时, X ‾ − Y ‾ ∼ N ( μ 1 − μ 2 , σ 2 n 1 + σ 2 n 2 ) \overline{X}-\overline{Y} \sim N\left(\mu_1-\mu_2,\dfrac{\sigma^2}{n_1}+\dfrac{\sigma^2}{n_2}\right) XYN(μ1μ2,n1σ2+n2σ2),令 U = ( X ‾ − Y ‾ ) − ( μ 1 − μ 2 ) σ 2 n 1 + σ 2 n 2 ∼ N ( 0 , 1 ) U=\dfrac{(\overline{X}-\overline{Y})-(\mu_1-\mu_2)}{\sqrt{\dfrac{\sigma^2}{n_1}+\dfrac{\sigma^2}{n_2}}} \sim N(0,1) U=n1σ2+n2σ2 (XY)(μ1μ2)N(0,1) V = ( n 1 − 1 ) S 1 2 σ 2 + ( n 2 − 1 ) S 2 2 σ 2 ∼ χ 2 ( n 1 + n 2 − 2 ) V=\dfrac{(n_1-1)S_1^2}{\sigma^2}+\dfrac{(n_2-1)S_2^2}{\sigma^2} \sim \chi^2(n_1+n_2-2) V=σ2(n11)S12+σ2(n21)S22χ2(n1+n22),记 S w 2 = ( n 1 − 1 ) S 1 2 + ( n 2 − 1 ) S 2 2 n 1 + n 2 − 2 S_w^2=\dfrac{(n_1-1)S_1^2+(n_2-1)S_2^2}{n_1+n_2-2} Sw2=n1+n22(n11)S12+(n21)S22,则 ( X ‾ − Y ‾ ) − ( μ 1 − μ 2 ) S w 1 n 1 + 1 n 2 = U V / ( n 1 + n 2 − 2 ) ∼ t ( n 1 + n 2 − 2 ) \dfrac{(\overline{X}-\overline{Y})-(\mu_1-\mu_2)}{S_w\sqrt{\dfrac{1}{n_1}+\dfrac{1}{n_2}}}=\dfrac{U}{\sqrt{V/(n_1+n_2-2)}} \sim t(n_1+n_2-2) Swn11+n21 (XY)(μ1μ2)=V/(n1+n22) Ut(n1+n22)

参数估计

矩估计

  • θ 1 , θ 2 , … , θ m \theta_1,\theta_2,\dots,\theta_m θ1,θ2,,θm 是总体 X X X 的带估计参数,并假定 X X X 的前 m m m 阶矩存在,矩估计的步骤如下:
    • 求总体 X X X 的前 m m m 阶矩(不妨设是原点矩) μ 1 , μ 2 , … , μ m \mu_1,\mu_2,\dots,\mu_m μ1,μ2,,μm,一般地,这些矩可以写成待估计参数 θ 1 , θ 2 , … , θ m \theta_1,\theta_2,\dots,\theta_m θ1,θ2,,θm 的函数形式,记为 { μ 1 = E ( X ) = g 1 ( θ 1 , θ 2 , … , θ m ) μ 2 = E ( X 2 ) = g 2 ( θ 1 , θ 2 , … , θ m ) ⋯ ⋯ μ m = E ( X m ) = g m ( θ 1 , θ 2 , … , θ m ) \begin{cases}\mu_1=E(X)=g_1(\theta_1,\theta_2,\dots,\theta_m) \\ \mu_2=E(X^2)=g_2(\theta_1,\theta_2,\dots,\theta_m) \\ \cdots \cdots \\ \mu_m=E(X^m)=g_m(\theta_1,\theta_2,\dots,\theta_m)\end{cases} μ1=E(X)=g1(θ1,θ2,,θm)μ2=E(X2)=g2(θ1,θ2,,θm)μm=E(Xm)=gm(θ1,θ2,,θm)
    • 由上述方程组可以反解出 θ 1 , θ 2 , … , θ m \theta_1,\theta_2,\dots,\theta_m θ1,θ2,,θm 关于前 m m m 阶矩的函数表达式,记为 { θ 1 = h 1 ( μ 1 , μ 2 , … , μ m ) θ 2 = h 2 ( μ 1 , μ 2 , … , μ m ) ⋯ ⋯ θ m = h m ( μ 1 , μ 2 , … , μ m ) \begin{cases}\theta_1=h_1(\mu_1,\mu_2,\dots,\mu_m) \\ \theta_2=h_2(\mu_1,\mu_2,\dots,\mu_m) \\ \cdots \cdots \\ \theta_m=h_m(\mu_1,\mu_2,\dots,\mu_m)\end{cases} θ1=h1(μ1,μ2,,μm)θ2=h2(μ1,μ2,,μm)θm=hm(μ1,μ2,,μm)
    • 以原点矩 A i A_i Ai 代替 μ i \mu_i μi,得到各个参数的点估计量 { θ ^ 1 = h 1 ( A 1 , A 2 , … , A m ) θ ^ 2 = h 2 ( A 1 , A 2 , … , A m ) ⋯ ⋯ θ ^ m = h m ( A 1 , A 2 , … , A m ) \begin{cases}\hat{\theta}_1=h_1(A_1,A_2,\dots,A_m) \\ \hat{\theta}_2=h_2(A_1,A_2,\dots,A_m) \\ \cdots \cdots \\ \hat{\theta}_m=h_m(A_1,A_2,\dots,A_m)\end{cases} θ^1=h1(A1,A2,,Am)θ^2=h2(A1,A2,,Am)θ^m=hm(A1,A2,,Am)
  • 矩估计中也可以用部分总体中心距 ν i \nu_i νi 代替原点矩 μ i \mu_i μi,用样本中心距 B i B_i Bi 代替原点矩 A i A_i Ai

极大似然估计

  • 似然函数 L ( θ ) L(\theta) L(θ)
    • X X X 为离散型总体,其概率分布律为 P { X = x } = p ( x ; θ ) P\{X=x\}=p(x;\theta) P{X=x}=p(x;θ) θ ∈ Θ \theta \in \Theta θΘ 是未知的待估参数, Θ \Theta Θ 为参数空间, X 1 , X 2 , … , X n X_1,X_2,\dots,X_n X1,X2,,Xn 是来自总体 X X X 的样本,设 x 1 , x 2 , … , x n x_1,x_2,\dots,x_n x1,x2,,xn 是已经得到的样本值,则样本 X 1 , X 2 , … , X n X_1,X_2,\dots,X_n X1,X2,,Xn 取到值 x 1 , x 2 , … , x n x_1,x_2,\dots,x_n x1,x2,,xn 的概率为 P { X 1 = x 1 , X 2 = x 2 , … , X n = x n } = ∏ i = 1 n P { X i = x i } = ∏ i = 1 n p ( x i ; θ ) P\{X_1=x_1,X_2=x_2,\dots,X_n=x_n\}=\displaystyle\prod_{i=1}^n{P\{X_i=x_i\}}=\displaystyle\prod_{i=1}^n{p(x_i;\theta)} P{X1=x1,X2=x2,,Xn=xn}=i=1nP{Xi=xi}=i=1np(xi;θ),记似然函数 L ( θ ) = L ( θ ; x 1 , x 2 , … , x n ) = ∏ i = 1 n p ( x i ; θ ) L(\theta)=L(\theta;x_1,x_2,\dots,x_n)=\displaystyle\prod_{i=1}^n{p(x_i;\theta)} L(θ)=L(θ;x1,x2,,xn)=i=1np(xi;θ)
    • X X X 为连续型总体时,设有密度函数 f ( x ; θ ) f(x;\theta) f(x;θ) θ ∈ Θ \theta \in \Theta θΘ 是未知的待估参数, Θ \Theta Θ 为参数空间, X 1 , X 2 , … , X n X_1,X_2,\dots,X_n X1,X2,,Xn 是来自总体 X X X 的样本,设 x 1 , x 2 , … , x n x_1,x_2,\dots,x_n x1,x2,,xn 是已经得到的样本值,此时似然函数 L ( θ ) = L ( θ ; x 1 , x 2 , … , x n ) = ∏ i = 1 n f ( x i ; θ ) L(\theta)=L(\theta;x_1,x_2,\dots,x_n)=\displaystyle\prod_{i=1}^n{f(x_i;\theta)} L(θ)=L(θ;x1,x2,,xn)=i=1nf(xi;θ)
  • 极大似然估计寻求参数 θ \theta θ 的估计值 θ ^ \hat\theta θ^,使得 L ( θ ) L(\theta) L(θ) 取到极大值,即 L ( θ ^ ) = max ⁡ θ ∈ Θ L ( θ ; x 1 , x 2 , … , x n ) L(\hat\theta)=\displaystyle\max_{\theta \in \Theta}{L(\theta;x_1,x_2,\dots,x_n)} L(θ^)=θΘmaxL(θ;x1,x2,,xn),此时
    • θ ^ = θ ^ ( x 1 , x 2 , … , x n ) \hat\theta=\hat\theta(x_1,x_2,\dots,x_n) θ^=θ^(x1,x2,,xn) 称为极大似然估计值
    • 相应的统计量 θ ^ ( X 1 , X 2 , … , X n ) \hat\theta(X_1,X_2,\dots,X_n) θ^(X1,X2,,Xn) 称为极大似然估计量,简记为 M L E \mathrm{MLE} MLE
  • 寻求极大似然估计常常采用微分方法:
    • 求解似然方程 ∂ L ( θ ) ∂ θ ∣ θ = θ ^ = 0 \left.\dfrac{\partial L(\theta)}{\partial \theta}\right|_{\theta=\hat\theta}=0 θL(θ)θ=θ^=0
    • 为了计算方便,往往事先进行取对数操作,记 l ( θ ) = ln ⁡ L ( θ ) l(\theta)=\ln L(\theta) l(θ)=lnL(θ) 为对数似然函数
    • 此时求解对数似然方程 ∂ l ( θ ) ∂ θ ∣ θ = θ ^ = ∂ ln ⁡ L ( θ ) ∂ θ ∣ θ = θ ^ = 0 \left.\dfrac{\partial l(\theta)}{\partial \theta}\right|_{\theta=\hat\theta}=\left.\dfrac{\partial\ln L(\theta)}{\partial \theta}\right|_{\theta=\hat\theta}=0 θl(θ)θ=θ^=θlnL(θ)θ=θ^=0
  • 极大似然估计的不变性:设参数 θ \theta θ 的极大似然估计为 θ ^ \hat\theta θ^ θ ∗ = g ( θ ) \theta^*=g(\theta) θ=g(θ) θ \theta θ 的连续函数,则参数 θ ∗ \theta^* θ 的极大似然估计为 θ ^ ∗ = g ( θ ^ ) \hat\theta^*=g(\hat\theta) θ^=g(θ^)

无偏性准则

  • θ ∈ Θ \theta \in \Theta θΘ 是总体 X X X 的待估参数, X 1 , X 2 , … , X n X_1,X_2,\dots,X_n X1,X2,,Xn 是来自总体 X X X 的样本,若估计量 θ ^ ( X 1 , X 2 , … , X n ) \hat\theta(X_1,X_2,\dots,X_n) θ^(X1,X2,,Xn) 的期望存在,且满足 E ( θ ^ ) = θ , ∀ θ ∈ Θ E(\hat\theta)=\theta, \forall \theta \in \Theta E(θ^)=θ,θΘ,则称 θ ^ \hat\theta θ^ θ \theta θ 的无偏估计
    • E ( θ ^ ) ≠ θ E(\hat\theta) \ne \theta E(θ^)=θ,则称 E ( θ ^ ) − θ E(\hat\theta)-\theta E(θ^)θ 为估计量 θ ^ \hat\theta θ^ 的偏差
    • E ( θ ^ ) ≠ θ E(\hat\theta) \ne \theta E(θ^)=θ,但 lim ⁡ n → + ∞ E ( θ ^ ) = θ \displaystyle\lim_{n \to +\infty}{E(\hat\theta)}=\theta n+limE(θ^)=θ,则称 θ ^ \hat\theta θ^ θ \theta θ 的渐进无偏估计

有效性准则

  • θ ^ 1 = θ ^ 1 ( X 1 , X 2 , … , X n ) \hat\theta_1=\hat\theta_1(X_1,X_2,\dots,X_n) θ^1=θ^1(X1,X2,,Xn) θ ^ 2 = θ ^ 2 ( X 1 , X 2 , … , X n ) \hat\theta_2=\hat\theta_2(X_1,X_2,\dots,X_n) θ^2=θ^2(X1,X2,,Xn) 都是参数 θ \theta θ 的无偏估计,若 ∀ θ ∈ Θ \forall \theta \in \Theta θΘ,有 V a r θ ( θ ^ 1 ) ≤ V a r θ ( θ ^ 2 ) \mathrm{Var}_\theta(\hat\theta_1) \leq \mathrm{Var}_\theta(\hat\theta_2) Varθ(θ^1)Varθ(θ^2),且至少有一个 θ \theta θ 使不等号成立,则称 θ ^ 1 \hat\theta_1 θ^1 θ ^ 2 \hat\theta_2 θ^2 有效

均方误差准则

  • θ ^ = θ ^ ( X 1 , X 2 , … , X n ) \hat\theta=\hat\theta(X_1,X_2,\dots,X_n) θ^=θ^(X1,X2,,Xn) 是参数 θ \theta θ 的一般估计量,称 E [ ( θ ^ − θ ) 2 ] E[(\hat\theta-\theta)^2] E[(θ^θ)2] 是估计量 θ ^ \hat\theta θ^ 的均方误差,记作 M s e ( θ ^ ) = V a r ( θ ^ ) + ( E ( θ ^ ) − θ ) 2 \mathrm{Mse}(\hat\theta)=\mathrm{Var}(\hat\theta)+(E(\hat\theta)-\theta)^2 Mse(θ^)=Var(θ^)+(E(θ^)θ)2
  • θ ^ 1 \hat\theta_1 θ^1 θ ^ 2 \hat\theta_2 θ^2 都是参数 θ \theta θ 的估计量,若 ∀ θ ∈ Θ \forall \theta \in \Theta θΘ,有 M s e ( θ ^ 1 ) ≤ M s e ( θ ^ 2 ) \mathrm{Mse}(\hat\theta_1) \leq \mathrm{Mse}(\hat\theta_2) Mse(θ^1)Mse(θ^2),且至少有一个 θ \theta θ 使不等号成立,则称 θ ^ 1 \hat\theta_1 θ^1 优于 θ ^ 2 \hat\theta_2 θ^2
  • θ ^ \hat\theta θ^ 是参数 θ \theta θ 的无偏估计,即 E ( θ ^ ) = θ E(\hat\theta)=\theta E(θ^)=θ,则 M s e ( θ ^ ) = V a r ( θ ^ ) \mathrm{Mse}(\hat\theta)=\mathrm{Var}(\hat\theta) Mse(θ^)=Var(θ^)
  • 当用于无偏估计之间的比较时,均方误差准则等价于有效性准则

相合性准则

  • θ ^ n = θ ^ ( X 1 , X 2 , … , X n ) \hat\theta_n=\hat\theta(X_1,X_2,\dots,X_n) θ^n=θ^(X1,X2,,Xn) 是参数 θ \theta θ 的一般估计量,若对于任意 ε > 0 \varepsilon>0 ε>0,有 lim ⁡ n → + ∞ P { ∣ θ ^ n − θ ∣ < ε } = 1 \displaystyle\lim_{n \to +\infty}{P\{|\hat\theta_n-\theta|<\varepsilon\}}=1 n+limP{θ^nθ<ε}=1,即 θ ^ n \hat\theta_n θ^n 依概率收敛于 θ \theta θ,则称 θ ^ n \hat\theta_n θ^n θ \theta θ 的相合估计量,记作 θ ^ n → P θ \hat\theta_n \xrightarrow{P} \theta θ^nP θ
  • 一般地,矩估计得到的参数估计都满足相合性,极大似然估计在总体分布满足一定条件下求得的参数估计才是相合估计量

单个正态总体的参数区间估计

  • 均值 μ \mu μ 的置信区间( σ 2 \sigma^2 σ2 已知):
    • 常用 μ \mu μ 的点估计为样本均值 X ‾ \overline{X} X,有 X ‾ ∼ N ( μ , σ 2 n ) \overline{X} \sim N\left(\mu,\dfrac{\sigma^2}{n}\right) XN(μ,nσ2),即 X ‾ − μ σ / n ∼ N ( 0 , 1 ) \dfrac{\overline{X}-\mu}{\sigma/\sqrt{n}} \sim N(0,1) σ/n XμN(0,1)
    • 取枢轴量 G ( X 1 , X 2 , … , X n ; μ ) = X ‾ − μ σ / n G(X_1,X_2,\dots,X_n;\mu)=\dfrac{\overline{X}-\mu}{\sigma/\sqrt{n}} G(X1,X2,,Xn;μ)=σ/n Xμ
    • 设常数 a < b a<b a<b,且满足 P { a < X ‾ − μ σ / n < b } = P { X ‾ − b σ n < μ < X ‾ − a σ n } = 1 − α P\left\{a<\dfrac{\overline{X}-\mu}{\sigma/\sqrt{n}}<b\right\}=P\left\{\overline{X}-b\dfrac{\sigma}{\sqrt{n}}<\mu<\overline{X}-a\dfrac{\sigma}{\sqrt{n}}\right\}=1-\alpha P{a<σ/n Xμ<b}=P{Xbn σ<μ<Xan σ}=1α
    • 区间平均长度 L = ( b − a ) σ n L=(b-a)\dfrac{\sigma}{\sqrt{n}} L=(ba)n σ,根据正态分布对称性,令 a = − b = − z α / 2 a=-b=-z_{\alpha/2} a=b=zα/2 使区间平均长度最短
    • 此时置信区间为 ( X ‾ − σ n z α / 2 , X ‾ + σ n z α / 2 ) \left(\overline{X}-\dfrac{\sigma}{\sqrt{n}}z_{\alpha/2}, \overline{X}+\dfrac{\sigma}{\sqrt{n}}z_{\alpha/2}\right) (Xn σzα/2,X+n σzα/2),简记为 ( X ‾ ± σ n z α / 2 ) \left(\overline{X} \pm \dfrac{\sigma}{\sqrt{n}}z_{\alpha/2}\right) (X±n σzα/2)
  • 均值 μ \mu μ 的置信区间( σ 2 \sigma^2 σ2 未知):
    • 考虑 σ 2 \sigma^2 σ2 的无偏估计 S 2 S^2 S2,有 X ‾ − μ S / n ∼ t ( n − 1 ) \dfrac{\overline{X}-\mu}{S/\sqrt{n}} \sim t(n-1) S/n Xμt(n1)
    • 取枢轴量 G ( X 1 , X 2 , … , X n ; μ ) = X ‾ − μ S / n G(X_1,X_2,\dots,X_n;\mu)=\dfrac{\overline{X}-\mu}{S/\sqrt{n}} G(X1,X2,,Xn;μ)=S/n Xμ
    • P { ∣ X ‾ − μ S / n ∣ < t α / 2 ( n − 1 ) } = P { X ‾ − S n t α / 2 ( n − 1 ) < μ < X ‾ + S n t α / 2 ( n − 1 ) } = 1 − α P\left\{\left|\dfrac{\overline{X}-\mu}{S/\sqrt{n}}\right|<t_{\alpha/2}(n-1)\right\}=P\left\{\overline{X}-\dfrac{S}{\sqrt{n}}t_{\alpha/2}(n-1)<\mu<\overline{X}+\dfrac{S}{\sqrt{n}}t_{\alpha/2}(n-1)\right\}=1-\alpha P{S/n Xμ<tα/2(n1)}=P{Xn Stα/2(n1)<μ<X+n Stα/2(n1)}=1α
    • 根据 t t t 分布对称性,置信区间取 ( X ‾ ± S n t α / 2 ( n − 1 ) ) \left(\overline{X} \pm \dfrac{S}{\sqrt{n}}t_{\alpha/2}(n-1)\right) (X±n Stα/2(n1))
  • 成对数据情形(不相互独立),均值差 μ 1 − μ 2 \mu_1-\mu_2 μ1μ2 的置信区间:
    • D i = X i − Y i D_i=X_i-Y_i Di=XiYi,则 D ‾ = X ‾ − Y ‾ , S D 2 = 1 n − 1 ∑ i = 1 n ( D i − D ‾ ) 2 \overline{D}=\overline{X}-\overline{Y}, S_D^2=\dfrac{1}{n-1}\displaystyle\sum_{i=1}^n{(D_i-\overline{D})^2} D=XY,SD2=n11i=1n(DiD)2
    • μ D \mu_D μD 的置信区间取 ( D ‾ ± S D n t α / 2 ( n − 1 ) ) \left(\overline{D} \pm \dfrac{S_D}{\sqrt{n}}t_{\alpha/2}(n-1)\right) (D±n SDtα/2(n1))
  • 方差 σ 2 \sigma^2 σ2 的置信区间:
    • 考虑 ( n − 1 ) S 2 σ 2 ∼ χ 2 ( n − 1 ) \dfrac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1) σ2(n1)S2χ2(n1)
    • 取枢轴量 G ( X 1 , X 2 , … , X n ; σ 2 ) = ( n − 1 ) S 2 σ 2 G(X_1,X_2,\dots,X_n;\sigma^2)=\dfrac{(n-1)S^2}{\sigma^2} G(X1,X2,,Xn;σ2)=σ2(n1)S2
    • P { χ 1 − α / 2 2 ( n − 1 ) < ( n − 1 ) S 2 σ 2 < χ α / 2 2 ( n − 1 ) } = P { ( n − 1 ) S 2 χ α / 2 2 ( n − 1 ) < σ 2 < ( n − 1 ) S 2 χ 1 − α / 2 2 ( n − 1 ) } = 1 − α P\left\{\chi_{1-\alpha/2}^2(n-1)<\dfrac{(n-1)S^2}{\sigma^2}<\chi_{\alpha/2}^2(n-1)\right\}=P\left\{\dfrac{(n-1)S^2}{\chi_{\alpha/2}^2(n-1)}<\sigma^2<\dfrac{(n-1)S^2}{\chi_{1-\alpha/2}^2(n-1)}\right\}=1-\alpha P{χ1α/22(n1)<σ2(n1)S2<χα/22(n1)}=P{χα/22(n1)(n1)S2<σ2<χ1α/22(n1)(n1)S2}=1α
    • σ 2 \sigma^2 σ2 的置信区间取 ( ( n − 1 ) S 2 χ α / 2 2 ( n − 1 ) , ( n − 1 ) S 2 χ 1 − α / 2 2 ( n − 1 ) ) \left(\dfrac{(n-1)S^2}{\chi_{\alpha/2}^2(n-1)}, \dfrac{(n-1)S^2}{\chi_{1-\alpha/2}^2(n-1)}\right) (χα/22(n1)(n1)S2,χ1α/22(n1)(n1)S2)
    • 由于 χ 2 \chi^2 χ2 分布的密度函数不对称,故上述置信区间不满足区间平均长度最短,但这样的解给实际应用带来方便

两个正态总体的参数区间估计

  • 均值差 μ 1 − μ 2 \mu_1-\mu_2 μ1μ2 的置信区间( σ 2 \sigma^2 σ2 σ 2 2 \sigma_2^2 σ22 已知):
    • 利用 μ 1 − μ 2 \mu_1-\mu_2 μ1μ2 的无偏估计 X ‾ − Y ‾ \overline{X}-\overline{Y} XY,有 X ‾ − Y ‾ ∼ N ( μ 1 − μ 2 , σ 1 2 n + σ 2 2 n ) \overline{X}-\overline{Y} \sim N\left(\mu_1-\mu_2, \dfrac{\sigma_1^2}{n}+\dfrac{\sigma_2^2}{n}\right) XYN(μ1μ2,nσ12+nσ22)
    • μ 1 − μ 2 \mu_1-\mu_2 μ1μ2 的置信区间取 ( ( X ‾ − Y ‾ ) ± z α / 2 σ 1 2 n + σ 2 2 n ) \left((\overline{X}-\overline{Y}) \pm z_{\alpha/2}\sqrt{\dfrac{\sigma_1^2}{n}+\dfrac{\sigma_2^2}{n}}\right) ((XY)±zα/2nσ12+nσ22 )
  • 均值差 μ 1 − μ 2 \mu_1-\mu_2 μ1μ2 的置信区间( σ 2 = σ 2 2 = σ 2 \sigma^2=\sigma_2^2=\sigma^2 σ2=σ22=σ2,但未知):
    • 利用 S w 2 = ( n 1 − 1 ) S 1 2 + ( n 2 − 1 ) S 2 2 n 1 + n 2 − 2 S_w^2=\dfrac{(n_1-1)S_1^2+(n_2-1)S_2^2}{n_1+n_2-2} Sw2=n1+n22(n11)S12+(n21)S22,有 ( X ‾ − Y ‾ ) − ( μ 1 − μ 2 ) S w 1 n 1 + 1 n 2 ∼ t ( n 1 + n 2 − 2 ) \dfrac{(\overline{X}-\overline{Y})-(\mu_1-\mu_2)}{S_w\sqrt{\dfrac{1}{n_1}+\dfrac{1}{n_2}}} \sim t(n_1+n_2-2) Swn11+n21 (XY)(μ1μ2)t(n1+n22)
    • μ 1 − μ 2 \mu_1-\mu_2 μ1μ2 的置信区间取 ( ( X ‾ − Y ‾ ) ± t α / 2 ( n 1 + n 2 − 2 ) S w 1 n 1 + 1 n 2 ) \left((\overline{X}-\overline{Y}) \pm t_{\alpha/2}(n_1+n_2-2)S_w\sqrt{\dfrac{1}{n_1}+\dfrac{1}{n_2}}\right) ((XY)±tα/2(n1+n22)Swn11+n21 )
  • 方差比 σ 1 2 σ 2 2 \dfrac{\sigma_1^2}{\sigma_2^2} σ22σ12 的置信区间:
    • 利用 σ 1 2 σ 2 2 \dfrac{\sigma_1^2}{\sigma_2^2} σ22σ12 的点估计 S 1 2 S 2 2 \dfrac{S_1^2}{S_2^2} S22S12,有 S 1 2 S 2 2 / σ 1 2 σ 2 2 = S 1 2 / σ 1 2 S 2 2 / σ 2 2 ∼ F ( n 1 − 1 , n 2 − 1 ) \left.\dfrac{S_1^2}{S_2^2} \middle/ \dfrac{\sigma_1^2}{\sigma_2^2}\right.=\dfrac{S_1^2/\sigma_1^2}{S_2^2/\sigma_2^2} \sim F(n_1-1,n_2-1) S22S12/σ22σ12=S22/σ22S12/σ12F(n11,n21)
    • σ 1 2 σ 2 2 \dfrac{\sigma_1^2}{\sigma_2^2} σ22σ12 的置信区间取 ( S 1 2 / S 2 2 F α / 2 ( n 1 + n 2 − 2 ) , S 1 2 / S 2 2 F 1 − α / 2 ( n 1 + n 2 − 2 ) ) \left(\dfrac{S_1^2/S_2^2}{F_{\alpha/2}(n_1+n_2-2)}, \dfrac{S_1^2/S_2^2}{F_{1-\alpha/2}(n_1+n_2-2)}\right) (Fα/2(n1+n22)S12/S22,F1α/2(n1+n22)S12/S22)

假设检验

单个正态总体参数的假设检验

  • 均值 μ \mu μ 的假设检验( σ 2 \sigma^2 σ2 已知),称为 Z Z Z 检验:
    • 考虑双侧假设 H 0 : μ = μ 0 , H 1 : μ ≠ μ 0 H_0:\mu=\mu_0,H_1:\mu \ne \mu_0 H0:μ=μ0,H1:μ=μ0,取检验统计量为 Z = X ‾ − μ 0 σ / n Z=\dfrac{\overline{X}-\mu_0}{\sigma/\sqrt{n}} Z=σ/n Xμ0,拒绝域 W = { ∣ Z ∣ = ∣ X ‾ − μ 0 σ / n ∣ ≥ z α / 2 } W=\left\{|Z|=\left|\dfrac{\overline{X}-\mu_0}{\sigma/\sqrt{n}}\right| \ge z_{\alpha/2}\right\} W={Z=σ/n Xμ0zα/2}
      • 对给定样本值 x 1 , x 2 , … , x n x_1,x_2,\dots,x_n x1,x2,,xn,检验统计量 Z Z Z 的取值 z 0 = x ‾ − μ 0 σ / n z_0=\dfrac{\overline{x}-\mu_0}{\sigma/\sqrt{n}} z0=σ/n xμ0,当 ∣ z 0 ∣ ≥ z α / 2 |z_0| \ge z_{\alpha/2} z0zα/2 时,拒绝原假设
      • P − = P H 0 { ∣ Z ∣ ≥ ∣ z 0 ∣ } = 2 P H 0 { Z ≥ ∣ z 0 ∣ } = 2 − 2 Φ ( ∣ z 0 ∣ ) P_-=P_{H_0}\{|Z| \ge |z_0|\}=2P_{H_0}\{Z \ge |z_0|\}=2-2\Phi(|z_0|) P=PH0{Zz0}=2PH0{Zz0}=22Φ(z0),当 P − P_- P 值小于等于显著水平 α \alpha α 时拒绝原假设
    • 考虑左侧假设 H 0 : μ ≥ μ 0 , H 1 : μ < μ 0 H_0:\mu \ge \mu_0,H_1:\mu<\mu_0 H0:μμ0,H1:μ<μ0,取检验统计量为 Z = X ‾ − μ 0 σ / n Z=\dfrac{\overline{X}-\mu_0}{\sigma/\sqrt{n}} Z=σ/n Xμ0,拒绝域 W = { Z = X ‾ − μ 0 σ / n ≤ c } W=\left\{Z=\dfrac{\overline{X}-\mu_0}{\sigma/\sqrt{n}} \leq c\right\} W={Z=σ/n Xμ0c}
      • 犯第 I 类错误的概率 α ( μ , c ) = P { X ‾ − μ 0 σ / n ≤ c | μ ≥ μ 0 } \alpha(\mu,c)=P\left\{\dfrac{\overline{X}-\mu_0}{\sigma/\sqrt{n}} \leq c \middle| \mu \ge \mu_0\right\} α(μ,c)=P{σ/n Xμ0cμμ0},由于 Z Z Z 不服从标准正态分布,而是 Z ∼ N ( μ − μ 0 σ / n , 1 ) Z \sim N\left(\dfrac{\mu-\mu_0}{\sigma/\sqrt{n}}, 1\right) ZN(σ/n μμ0,1),因此 α ( μ , c ) = Φ ( c − μ − μ 0 σ / n 1 ) = Φ ( c − μ − μ 0 σ / n ) , μ ≥ μ 0 \alpha(\mu,c)=\Phi\left(\dfrac{c-\dfrac{\mu-\mu_0}{\sigma/\sqrt{n}}}{1}\right)=\Phi\left(c-\dfrac{\mu-\mu_0}{\sigma/\sqrt{n}}\right), \mu \ge \mu_0 α(μ,c)=Φ1cσ/n μμ0=Φ(cσ/n μμ0),μμ0
      • 当取 c = z 1 − α / 2 = − z α c=z_{1-\alpha/2}=-z_\alpha c=z1α/2=zα 时,犯第 II 类错误的概率最小,此时拒绝域 W = { Z = X ‾ − μ 0 σ / n ≤ − z α } W=\left\{Z=\dfrac{\overline{X}-\mu_0}{\sigma/\sqrt{n}} \leq -z_\alpha\right\} W={Z=σ/n Xμ0zα}
      • P − = sup ⁡ μ ≥ μ 0 P { Z ≤ z 0 } = P { Z ≤ z 0 ∣ μ = μ 0 } = Φ ( z 0 ) P_-=\displaystyle\sup_{\mu \ge \mu_0}{P\{Z \leq z_0\}}=P\{Z \leq z_0 | \mu=\mu_0\}=\Phi(z_0) P=μμ0supP{Zz0}=P{Zz0μ=μ0}=Φ(z0),当 P − P_- P 值小于等于显著水平 α \alpha α 时拒绝原假设
    • 考虑右侧假设 H 0 : μ ≤ μ 0 , H 1 : μ > μ 0 H_0:\mu \leq \mu_0,H_1:\mu>\mu_0 H0:μμ0,H1:μ>μ0,取检验统计量为 Z = X ‾ − μ 0 σ / n Z=\dfrac{\overline{X}-\mu_0}{\sigma/\sqrt{n}} Z=σ/n Xμ0,类似得到拒绝域 W = { Z = X ‾ − μ 0 σ / n ≥ z α } W=\left\{Z=\dfrac{\overline{X}-\mu_0}{\sigma/\sqrt{n}} \ge z_\alpha\right\} W={Z=σ/n Xμ0zα}
      • P − = sup ⁡ μ ≤ μ 0 P { Z ≥ z 0 } = P { Z ≥ z 0 ∣ μ = μ 0 } = 1 − Φ ( z 0 ) P_-=\displaystyle\sup_{\mu \leq \mu_0}{P\{Z \ge z_0\}}=P\{Z \ge z_0 | \mu=\mu_0\}=1-\Phi(z_0) P=μμ0supP{Zz0}=P{Zz0μ=μ0}=1Φ(z0),当 P − P_- P 值小于等于显著水平 α \alpha α 时拒绝原假设
  • 均值 μ \mu μ 的假设检验( σ 2 \sigma^2 σ2 未知),称为 t t t 检验:
    • 利用样本方差 S 2 S^2 S2 代替总体方差 σ 2 \sigma^2 σ2,取检验统计量 T = X ‾ − μ 0 S / n ∼ t ( n − 1 ) T=\dfrac{\overline{X}-\mu_0}{S/\sqrt{n}} \sim t(n-1) T=S/n Xμ0t(n1),对给定样本值 x 1 , x 2 , … , x n x_1,x_2,\dots,x_n x1,x2,,xn,检验统计量 T T T 的取值 t 0 = x ‾ − μ 0 σ / n t_0=\dfrac{\overline{x}-\mu_0}{\sigma/\sqrt{n}} t0=σ/n xμ0
    • 考虑双侧假设 H 0 : μ = μ 0 , H 1 : μ ≠ μ 0 H_0:\mu=\mu_0,H_1:\mu \ne \mu_0 H0:μ=μ0,H1:μ=μ0,拒绝域 W = { ∣ T ∣ = ∣ X ‾ − μ 0 S / n ∣ ≥ t α / 2 ( n − 1 ) } W=\left\{|T|=\left|\dfrac{\overline{X}-\mu_0}{S/\sqrt{n}}\right| \ge t_{\alpha/2}(n-1)\right\} W={T=S/n Xμ0tα/2(n1)} P − = 2 P H 0 { t ( n − 1 ) ≥ ∣ t 0 ∣ } P_-=2P_{H_0}\{t(n-1) \ge |t_0|\} P=2PH0{t(n1)t0}
    • 考虑左侧假设 H 0 : μ ≥ μ 0 , H 1 : μ < μ 0 H_0:\mu \ge \mu_0,H_1:\mu<\mu_0 H0:μμ0,H1:μ<μ0,拒绝域 W = { T = X ‾ − μ 0 S / n ≤ − t α ( n − 1 ) } W=\left\{T=\dfrac{\overline{X}-\mu_0}{S/\sqrt{n}} \leq -t_{\alpha}(n-1)\right\} W={T=S/n Xμ0tα(n1)} P − = sup ⁡ μ ≥ μ 0 P { T ≤ t 0 } = P { t ( n − 1 ) ≤ t 0 } P_-=\displaystyle\sup_{\mu \ge \mu_0}{P\{T \leq t_0\}}=P\{t(n-1) \leq t_0\} P=μμ0supP{Tt0}=P{t(n1)t0}
    • 考虑右侧假设 H 0 : μ ≤ μ 0 , H 1 : μ > μ 0 H_0:\mu \leq \mu_0,H_1:\mu>\mu_0 H0:μμ0,H1:μ>μ0,拒绝域 W = { T = X ‾ − μ 0 S / n ≥ t α ( n − 1 ) } W=\left\{T=\dfrac{\overline{X}-\mu_0}{S/\sqrt{n}} \ge t_{\alpha}(n-1)\right\} W={T=S/n Xμ0tα(n1)} P − = sup ⁡ μ ≤ μ 0 P { T ≥ t 0 } = P { t ( n − 1 ) ≥ t 0 } P_-=\displaystyle\sup_{\mu \leq \mu_0}{P\{T \ge t_0\}}=P\{t(n-1) \ge t_0\} P=μμ0supP{Tt0}=P{t(n1)t0}
  • 方差 σ 2 \sigma^2 σ2 的假设检验,称为 χ 2 \chi^2 χ2 检验:
    • 利用 σ 2 \sigma^2 σ2 的无偏估计 S 2 = 1 n − 1 ∑ i = 1 n ( X i − X ‾ ) 2 S^2=\dfrac{1}{n-1}\displaystyle\sum_{i=1}^n{(X_i-\overline{X})^2} S2=n11i=1n(XiX)2,有 ( n − 1 ) S 2 σ 2 ∼ χ 2 ( n − 1 ) \dfrac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1) σ2(n1)S2χ2(n1),取检验统计量 χ 2 = ( n − 1 ) S 2 σ 0 2 \chi^2=\dfrac{(n-1)S^2}{\sigma_0^2} χ2=σ02(n1)S2,代入样本值后的检验统计量 χ 0 2 = ( n − 1 ) s 2 σ 0 2 \chi_0^2=\dfrac{(n-1)s^2}{\sigma_0^2} χ02=σ02(n1)s2,记 p 0 = P H 0 { χ 2 ( n − 1 ) ≤ χ 0 2 } p_0=P_{H_0}\{\chi^2(n-1) \leq \chi_0^2\} p0=PH0{χ2(n1)χ02}
    • 考虑双侧假设 H 0 : σ 2 = σ 0 2 , H 1 : σ 2 ≠ σ 0 2 H_0:\sigma^2=\sigma_0^2,H_1:\sigma^2 \ne \sigma_0^2 H0:σ2=σ02,H1:σ2=σ02,拒绝域 W = { χ 2 ≥ χ α / 2 2 ( n − 1 ) } ∪ { χ 2 ≤ χ 1 − α / 2 2 ( n − 1 ) } W=\{\chi^2 \ge \chi_{\alpha/2}^2(n-1)\} \cup \{\chi^2 \leq \chi_{1-\alpha/2}^2(n-1)\} W={χ2χα/22(n1)}{χ2χ1α/22(n1)} P − = 2 min ⁡ ( p 0 , 1 − p 0 ) P_-=2\displaystyle\min(p_0,1-p_0) P=2min(p0,1p0)
    • 考虑左侧假设 H 0 : σ 2 ≥ σ 0 2 , H 1 : σ 2 < σ 0 2 H_0:\sigma^2 \ge \sigma_0^2,H_1:\sigma^2<\sigma_0^2 H0:σ2σ02,H1:σ2<σ02,拒绝域 W = { χ 2 ≤ χ 1 − α 2 ( n − 1 ) } W=\{\chi^2 \leq \chi_{1-\alpha}^2(n-1)\} W={χ2χ1α2(n1)} P − = p 0 P_-=p_0 P=p0
    • 考虑右侧假设 H 0 : σ 2 ≤ σ 0 2 , H 1 : σ 2 > σ 0 2 H_0:\sigma^2 \leq \sigma_0^2,H_1:\sigma^2>\sigma_0^2 H0:σ2σ02,H1:σ2>σ02,拒绝域 W = { χ 2 ≥ χ α 2 ( n − 1 ) } W=\{\chi^2 \ge \chi_{\alpha}^2(n-1)\} W={χ2χα2(n1)} P − = 1 − p 0 P_-=1-p_0 P=1p0

两个正态总体参数的假设检验

  • 均值差 μ 1 − μ 2 \mu_1-\mu_2 μ1μ2 的假设检验( σ 1 2 \sigma_1^2 σ12 σ 2 2 \sigma_2^2 σ22 已知):
    • 检验统计量 X ‾ − Y ‾ ∼ N ( μ 1 − μ 2 , σ 1 2 n 1 + σ 2 2 n 2 ) \overline{X}-\overline{Y} \sim N\left(\mu_1-\mu_2, \dfrac{\sigma_1^2}{n_1}+\dfrac{\sigma_2^2}{n_2}\right) XYN(μ1μ2,n1σ12+n2σ22)
    • 考虑双侧假设 H 0 : μ 1 = μ 2 , H 1 : μ 1 ≠ μ 2 H_0:\mu_1=\mu_2, H_1:\mu_1 \ne \mu_2 H0:μ1=μ2,H1:μ1=μ2,当 H 0 H_0 H0 成立时 X ‾ − Y ‾ ∼ N ( 0 , σ 1 2 n 1 + σ 2 2 n 2 ) \overline{X}-\overline{Y} \sim N\left(0, \dfrac{\sigma_1^2}{n_1}+\dfrac{\sigma_2^2}{n_2}\right) XYN(0,n1σ12+n2σ22),利用 Z Z Z 检验,得到拒绝域 W = { ∣ X ‾ − Y ‾ ∣ σ 1 2 n 1 + σ 2 2 n 2 ≥ z α / 2 } W=\left\{\dfrac{|\overline{X}-\overline{Y}|}{\sqrt{\dfrac{\sigma_1^2}{n_1}+\dfrac{\sigma_2^2}{n_2}}} \ge z_{\alpha/2}\right\} W=n1σ12+n2σ22 XYzα/2 P − = P H 0 { ∣ Z ∣ ≥ ∣ z 0 ∣ } = 2 P H 0 { Z ≥ ∣ z 0 ∣ } = 2 − 2 Φ ( ∣ z 0 ∣ ) P_-=P_{H_0}\{|Z| \ge |z_0|\}=2P_{H_0}\{Z \ge |z_0|\}=2-2\Phi(|z_0|) P=PH0{Zz0}=2PH0{Zz0}=22Φ(z0)
  • 均值差 μ 1 − μ 2 \mu_1-\mu_2 μ1μ2 的假设检验( σ 1 2 = σ 2 2 = σ 2 \sigma_1^2=\sigma_2^2=\sigma^2 σ12=σ22=σ2 但未知),称为两样本精确 t t t 检验:
    • 采用 σ 2 \sigma^2 σ2 的无偏估计 S w 2 = ( n 1 − 1 ) S 1 2 + ( n 2 − 1 ) S 2 2 n 1 + n 2 − 2 S_w^2=\dfrac{(n_1-1)S_1^2+(n_2-1)S_2^2}{n_1+n_2-2} Sw2=n1+n22(n11)S12+(n21)S22
    • 考虑双侧假设 H 0 : μ 1 = μ 2 , H 1 : μ 1 ≠ μ 2 H_0:\mu_1=\mu_2, H_1:\mu_1 \ne \mu_2 H0:μ1=μ2,H1:μ1=μ2,取检验统计量 T = X ‾ − Y ‾ S w 1 n 1 + 1 n 2 T=\dfrac{\overline{X}-\overline{Y}}{S_w\sqrt{\dfrac{1}{n_1}+\dfrac{1}{n_2}}} T=Swn11+n21 XY,当 H 0 H_0 H0 成立时 T ∼ t ( n 1 + n 2 − 2 ) T \sim t(n_1+n_2-2) Tt(n1+n22),得到拒绝域 W = { ∣ T ∣ ≥ t α / 2 ( n 1 + n 2 − 2 ) } W=\{|T| \ge t_{\alpha/2}(n_1+n_2-2)\} W={Ttα/2(n1+n22)} P − = P H 0 { ∣ T ∣ ≥ ∣ t 0 ∣ } = 2 P H 0 { t ( n 1 + n 2 − 2 ) ≥ ∣ t 0 ∣ } P_-=P_{H_0}\{|T| \ge |t_0|\}=2P_{H_0}\{t(n_1+n_2-2) \ge |t_0|\} P=PH0{Tt0}=2PH0{t(n1+n22)t0}
  • 方差比 σ 1 2 σ 2 2 \dfrac{\sigma_1^2}{\sigma_2^2} σ22σ12 的假设检验:
    • 取检验统计量 F = S 1 2 S 2 2 F=\dfrac{S_1^2}{S_2^2} F=S22S12,记代入样本值后的检验统计量 f 0 = s 1 2 s 2 2 f_0=\dfrac{s_1^2}{s_2^2} f0=s22s12,设 p 0 = P H 0 { F ≤ f 0 } = P { F ( n 1 − 1 , n 2 − 1 ) ≤ f 0 } p_0=P_{H_0}\{F \leq f_0\}=P\{F(n_1-1,n_2-1) \leq f_0\} p0=PH0{Ff0}=P{F(n11,n21)f0}
    • 考虑双侧假设 H 0 : σ 1 2 = σ 2 2 , H 1 : σ 1 2 ≠ σ 2 2 H_0:\sigma_1^2=\sigma_2^2, H_1:\sigma_1^2 \ne \sigma_2^2 H0:σ12=σ22,H1:σ12=σ22,当 H 0 H_0 H0 成立时 F ∼ F ( n 1 − 1 , n 2 − 1 ) F \sim F(n_1-1,n_2-1) FF(n11,n21),得到拒绝域 W = { F ≥ F α / 2 ( n 1 − 1 , n 2 − 1 ) } ∪ { F ≤ F 1 − α / 2 ( n 1 − 1 , n 2 − 1 ) } W=\{F \ge F_{\alpha/2}(n_1-1,n_2-1)\} \cup \{F \leq F_{1-\alpha/2}(n_1-1,n_2-1)\} W={FFα/2(n11,n21)}{FF1α/2(n11,n21)} P − = 2 min ⁡ ( p 0 , 1 − p 0 ) P_-=2\displaystyle\min(p_0, 1-p_0) P=2min(p0,1p0)
    • 考虑左侧假设 H 0 : σ 1 2 ≥ σ 2 2 , H 1 : σ 1 2 < σ 2 2 H_0:\sigma_1^2 \ge \sigma_2^2, H_1:\sigma_1^2<\sigma_2^2 H0:σ12σ22,H1:σ12<σ22 P − = p 0 P_-=p_0 P=p0
    • 考虑右侧侧假设 H 0 : σ 1 2 ≤ σ 2 2 , H 1 : σ 1 2 > σ 2 2 H_0:\sigma_1^2 \leq \sigma_2^2, H_1:\sigma_1^2>\sigma_2^2 H0:σ12σ22,H1:σ12>σ22 P − = 1 − p 0 P_-=1-p_0 P=1p0
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值