概率论总结

随机事件与概率

基本概念

随机试验

  • 试验可以在相同的条件下重复进行
  • 试验所有可能结果是明确可知道的,并且不止一个
  • 每一次试验会出现哪一个结果,事先并不确定

事件

  • 随机事件 A , B , C . . . A,B,C... A,B,C...
  • 必然事件 Ω \Omega Ω
  • 不可能事件 ∅ \varnothing

样本空间

  • 样本点:随机试验的每一个可能结果称为样本点,记为 ω \omega ω
  • 样本空间:样本点的全体组成的集合称为样本空间,记为 Ω \Omega Ω
  • 基本事件:由一个样本点构成的事件称为基本事件
  • 随机事件 A A A是由若干个基本事件组成的

概率

  • 描述性定义

    通常将随机事件 A A A发生的可能性大小的度量,称为事件 A A A发生的概率,记为 P ( A ) P(A) P(A)

  • 统计性定义

    在相同条件下做重复实验,事件 A A A出现的次数k和总的实验次数 n n n之比 k n \frac{k}{n} nk,称为事件 A A A在这 n n n次试验中出现的频率。当试验次数 n n n充分大时,频率将稳定于某常数 p p p的附近。 n n n越大,频率偏离这个常数 p p p的可能性越小。这个常数 p p p就称为事件 A A A的概率

  • 公理化定义

    设随机试验的样本空间为 Ω \Omega Ω,如果对每一个事件 A A A都有一个确定的实数 P ( A ) P(A) P(A),且事件函数 P ( ⋅ ) P(\cdot) P()满足:

    • 非负性: P ( A ) ≥ 0 P(A) \geq0 P(A)0
    • 规范性: P ( Ω ) = 1 P(\Omega) = 1 P(Ω)=1
    • 可列可加性:对于任意可列个互不相容的事件 P ( ∪ i = 1 n A i ) = ∑ i = 1 ∞ P ( A i ) P(\cup_{i=1}^nA_i)=\sum_{i=1}^{\infty}P(A_i) P(i=1nAi)=i=1P(Ai)

    则称 P ( ⋅ ) P(\cdot) P()为概率, P ( A ) P(A) P(A)为事件 A A A的概率

事件的独立性和独立重复实验

事件的独立性

P ( A B ) = P ( A ) P ( B ) P(AB)=P(A)P(B) P(AB)=P(A)P(B),则 A B AB AB相互独立, A B AB AB代表一个事件或几个事件。只判断两个基本事件独立只能说明是两两独立,想证明相互独立需要多维判断

试验的独立性

各个试验结果是相互独立的

独立试验序列概型

在相同条件下独立重复进行完全相同的试验,每次实验结果相关结果概率相同

n重伯努利概型

只有两个结果 A A A A ‾ \overline{A} A的试验重复 n n n

事件的关系和运算

概念定义
A ∪ B A \cup B AB
A ∩ B A \cap B AB
A − B = A − A B = A B ‾ A-B=A-AB=A\overline{B} AB=AAB=AB
包含 A ⊂ B A \subset B AB
相等 A = B    ⟺    A ⊂ B & B ⊂ A A=B \iff A \subset B \& B \subset A A=BAB&BA
相容 A B = ∅ AB=\varnothing AB=
互斥 A B ≠ ∅ AB \neq \varnothing AB=
对立 A ‾ \overline{A} A
完备事件组 ∪ i = 1 n A i = Ω , A i A j = ∅ \cup_{i=1}^nA_i=\Omega,A_iA_j= \varnothing i=1nAi=Ω,AiAj=
运算法则吸收律、交换律、结合律、分配律、对偶律
运算顺序先逆再交后并差

概率的基本性质与公式

名称公式
有界性 0 ≤ P ( A ) ≤ 1 , P ( ∅ ) = 0 , P ( Ω ) = 1 0 \leq P(A) \leq 1,P(\varnothing)=0,P(\Omega)=1 0P(A)1,P()=0,P(Ω)=1
单调性 A ⊂ B ⇒ P ( B − A ) = P ( B ) − P ( A ) , P ( B ) ≥ P ( A ) A \subset B \Rightarrow P(B-A)=P(B)-P(A),P(B) \geq P(A) ABP(BA)=P(B)P(A),P(B)P(A)
逆事件概率 P ( A ‾ ) = 1 − P ( A ) P(\overline{A})=1-P(A) P(A)=1P(A)
加法 P ( A ∪ B ) = P ( A ) + P ( B ) − P ( A B ) = P ( A B ) + P ( A B ‾ ) + P ( B A ‾ ) P(A\cup B)=P(A)+P(B)-P(AB)=P(AB)+P(A\overline{B})+P(B\overline{A}) P(AB)=P(A)+P(B)P(AB)=P(AB)+P(AB)+P(BA)
加法三维 P ( A ∪ B ∪ C ) = P ( A ) + P ( B ) + P ( C ) − P ( A B ) − P ( A C ) − P ( B C ) + P ( A B C ) P(A\cup B \cup C)=P(A)+P(B)+P(C)-P(AB)-P(AC)-P(BC)+P(ABC) P(ABC)=P(A)+P(B)+P(C)P(AB)P(AC)P(BC)+P(ABC)
减法 P ( A − B ) = P ( A ) − P ( A B ) = P ( A B ‾ ) P(A-B)=P(A)-P(AB)=P(A\overline B) P(AB)=P(A)P(AB)=P(AB)
条件概率 P ( B ∣ A ) = P ( A B ) P ( A ) P(B\mid A)=\frac{P(AB)}{P(A)} P(BA)=P(A)P(AB)
乘法 P ( A B ) = P ( A ) P ( B ∣ A ) P(AB)=P(A)P(B\mid A) P(AB)=P(A)P(BA)
多维乘法 P ( A 1 A 2 . . . A n ) = P ( A 1 ) P ( A 2 ∣ A 1 ) P ( A 3 ∣ A 1 A 2 ) . . . P ( A n ∣ A 1 A 2 . . . A n − 1 ) P(A_1A_2...A_n)=P(A_1)P(A_2\mid A_1)P(A_3\mid A_1A_2)...P(A_n\mid A_1A_2...A_{n-1}) P(A1A2...An)=P(A1)P(A2A1)P(A3A1A2)...P(AnA1A2...An1)
全概率公式 ∪ i = 1 n A i = Ω , A i A j = ∅ ⇒ B = ∪ i = 1 n A i B , P ( B ) = ∑ i = 1 n P ( A i ) P ( B ∣ A i ) \cup_{i=1}^nA_i=\Omega,A_iA_j= \varnothing \Rightarrow B=\cup_{i=1}^nA_iB,P(B)=\sum_{i=1}^nP(A_i)P(B\mid A_i) i=1nAi=Ω,AiAj=B=i=1nAiB,P(B)=i=1nP(Ai)P(BAi)
贝叶斯公式 ∪ i = 1 n A i = Ω , A i A j = ∅ ⇒ P ( A j ∣ B ) = P ( A j ) P ( B ∣ A j ) ∑ i = 1 n P ( A i ) P ( B ∣ A i ) \cup_{i=1}^nA_i=\Omega,A_iA_j= \varnothing \Rightarrow P(A_j\mid B)=\frac{P(A_j)P(B\mid A_j)}{\sum_{i=1}^nP(A_i)P(B\mid A_i)} i=1nAi=Ω,AiAj=P(AjB)=i=1nP(Ai)P(BAi)P(Aj)P(BAj)

古典概型和几何概型

要素古典概型几何概型
定义基本事件有限、等可能基本事件无限且具有几何度量、等可能
概率计算 P ( A ) = k n P(A)=\frac{k}{n} P(A)=nk P ( A ) = S A S Ω P(A)=\frac{S_A}{S_\Omega} P(A)=SΩSA

一维随机变量及其分布

随机变量

随机变量就是“其值会随机而定”的变量。设随机试验 E E E的样本空间为 Ω = ω \Omega={\omega} Ω=ω,如果对每一个 ω \omega ω,如果对每一个 ω ∈ Ω \omega \in \Omega ωΩ,都有唯一的实数 X ( ω ) X(\omega) X(ω)与之对应,并且对任意实数 x x x, { ω ∣ X ( ω ) ≤ x , ω ∈ Ω } \{\omega\mid X(\omega) \leq x,\omega \in \Omega\} {ωX(ω)x,ωΩ}是随机事件,则称定义在 Ω \Omega Ω上的实值单值函数 X ( ω ) X(\omega) X(ω)为随机变量。简记为 X X X

分布函数

X X X是随机变量, x x x是任意实数,称函数 F ( x ) = P { X ≤ x } F(x)=P\{X \leq x\} F(x)=P{Xx}为随机变量 X X X的分布函数,或称 X X X服从分布 F ( x ) F(x) F(x),记为 X ∼ F ( x ) X\sim F(x) XF(x)

性质公式
F ( x ) F(x) F(x)单调不减 x 1 < x 2 ⇒ F ( x 1 ) ≤ F ( x 2 ) x_1<x_2\Rightarrow F(x_1) \leq F(x_2) x1<x2F(x1)F(x2)
F ( x ) F(x) F(x)是右连续的 lim ⁡ x → x 0 + F ( x ) = F ( x 0 + 0 ) = F ( x 0 ) \lim_{x \rightarrow x_0^+}F(x)=F(x_0+0)=F(x_0) limxx0+F(x)=F(x0+0)=F(x0)
上下界 F ( − ∞ ) = lim ⁡ x → − ∞ = 0 , F ( + ∞ ) = lim ⁡ x → + ∞ = 1 F(-\infty)=\lim_{x\rightarrow -\infty}=0,F(+\infty)=\lim_{x\rightarrow +\infty}=1 F()=limx=0,F(+)=limx+=1
计算 P { X ≤ a } = F ( a ) P { X < a } = F ( a − 0 ) P { X = a } = F ( a ) − F ( a − 0 ) P\{X \leq a\}=F(a)\\P\{X < a\}=F(a-0)\\P\{X = a\}=F(a)-F(a-0) P{Xa}=F(a)P{X<a}=F(a0)P{X=a}=F(a)F(a0)

离散型随机变量和连续型随机变量

对比离散随机变量连续随机变量
描述 P { X = x i } = p i P\{X=x_i\}=p_i P{X=xi}=pi F ( x ) = ∫ − ∞ x f ( t ) d t F(x)=\int_{-\infty}^xf(t)dt F(x)=xf(t)dt
概念 P { X = x i } = p i P\{X=x_i\}=p_i P{X=xi}=pi X X X的分布列、分布律、概率分布 f ( x ) f(x) f(x) X X X的概率密度函数
表示表格或矩阵
特性1 P { X = x i } = P { X ≤ x i } − P { X < x i } = F ( x i ) − F ( x i − 0 ) P\{X=x_i\}=P\{X \leq x_i\}-P\{X<x_i\}=F(x_i)-F(x_i-0) P{X=xi}=P{Xxi}P{X<xi}=F(xi)F(xi0) P { X = c } = 0 P\{X=c\}=0 P{X=c}=0
特性2 P { X ∈ B } = ∑ x i ∈ B P { X = x i } P\{X\in B\}=\sum_{x_i \in B}P\{X=x_i\} P{XB}=xiBP{X=xi} P { X ∈ B } = ∫ B f ( x ) d x P\{X\in B\}=\int_Bf(x)dx P{XB}=Bf(x)dx
特性3 P { a < X ≤ b } = P { X ≤ b } − P { X ≤ a } = F ( b ) − F ( a ) P\{a<X\leq b\}=P\{X\leq b\}-P\{X\leq a\}=F(b)-F(a) P{a<Xb}=P{Xb}P{Xa}=F(b)F(a) P { a < X < b } = P { a ≤ X < b } = P { a < X ≤ b } = P { a ≤ X ≤ b } = ∫ a b f ( x ) d x = F ( b ) − F ( a ) P\{a<X<b\}=P\{a\leq X <b\}\\=P\{a<X\leq b\}=P\{a\leq X \leq b\}\\=\int_a^bf(x)dx=F(b)-F(a) P{a<X<b}=P{aX<b}=P{a<Xb}=P{aXb}=abf(x)dx=F(b)F(a)

常见的随机变量分布类型

分布名称符号定义期望方差
0 − 1 0-1 01分布 B ( 1 , p ) B(1,p) B(1,p) P { X = 1 } = p , P { X = 0 } = 1 − p P\{X=1\}=p,P\{X=0\}=1-p P{X=1}=p,P{X=0}=1p p p p p ( 1 − p ) p(1-p) p(1p)
二项分布 B ( n , p ) B(n,p) B(n,p) P { X = k } = C n k p k ( 1 − p ) n − k P\{X=k\}=C_n^kp^k(1-p)^{n-k} P{X=k}=Cnkpk(1p)nk n p np np n p ( 1 − p ) np(1-p) np(1p)
几何分布 G ( P ) G(P) G(P) P { X = k } = ( 1 − p ) k − 1 p P\{X=k\}=(1-p)^{k-1}p P{X=k}=(1p)k1p 1 p \frac{1}{p} p1 1 − p p 2 \frac{1-p}{p^2} p21p
超几何分布 H ( n , N , M ) H(n,N,M) H(n,N,M) P { X = k } = C M k C N M n − k C N n P\{X=k\}=\frac{C_M^kC_{N_M}^{n-k}}{C_N^n} P{X=k}=CNnCMkCNMnk n M N \frac{nM}{N} NnM
泊松分布 P ( λ ) P(\lambda) P(λ) P { X = k } = λ k k ! e − λ P\{X=k\}=\frac{\lambda^k}{k!}e^{-\lambda} P{X=k}=k!λkeλ λ \lambda λ λ \lambda λ
均匀分布 U ( a , b ) U(a,b) U(a,b) f ( x ) = 1 b − a ( a < x < b ) , e l s e = 0 f(x)=\frac{1}{b-a}(a<x<b),else =0 f(x)=ba1(a<x<b),else=0 a + b 2 \frac{a+b}{2} 2a+b ( b − a ) 2 12 \frac{(b-a)^2}{12} 12(ba)2
指数分布 E ( λ ) E(\lambda) E(λ) f ( x ) = λ e − λ x ( x > 0 ) , e l s e = 0 f(x)=\lambda e^{-\lambda x}(x>0),else =0 f(x)=λeλx(x>0),else=0 1 λ \frac{1}{\lambda} λ1 1 λ 2 \frac{1}{\lambda^2} λ21
正态分布 N ( μ , σ 2 ) N(\mu,\sigma^2) N(μ,σ2) f ( x ) = 1 2 π σ e − 1 2 ( x − u σ ) 2 f(x)=\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{1}{2}(\frac{x-u}{\sigma})^2} f(x)=2π σ1e21(σxu)2 μ \mu μ σ 2 \sigma^2 σ2
标准正态分布 N ( 0 , 1 ) N(0,1) N(0,1) φ ( x ) = 1 2 π e − 1 2 x 2 , \varphi(x)=\frac{1}{\sqrt{2\pi}}e^{-\frac{1}{2}x^2}, φ(x)=2π 1e21x2, 0 0 0 1 1 1
泊松分布

某时间段和场合下,源源不断的随机质点流的个数

泊松定理

X ∼ B ( n , p ) X \sim B(n,p) XB(n,p),当 n n n很大, p p p很小时,用泊松分布公式逼近二项分布效果比较好,二项分布可用泊松分布近似表示
C n k p k ( 1 − p ) n − k ≈ λ k k ! e − λ ( λ = n p ) C_n^kp^k(1-p)^{n-k} \approx \frac{\lambda^k}{k!}e^{-\lambda}(\lambda = np) Cnkpk(1p)nkk!λkeλ(λ=np)
特别当 n ≥ 20 , p ≤ 0.05 n \geq20,p \leq 0.05 n20,p0.05时,用泊松近似公式逼近二项分布效果比较好,特别当 n ≥ 100 , n p ≤ 10 n \geq 100,np \leq 10 n100,np10时,逼近效果更佳

有关正态分布的特性

X ∼ N ( 0 , 1 ) ⇒ Φ ( 0 ) = 1 2 , Φ ( − x ) = 1 − Φ ( x ) , P { X > μ α } = α , μ α 为 标 准 正 态 分 布 的 上 侧 α 分 位 数 X \sim N(0,1) \Rightarrow \Phi(0)=\frac{1}{2},\Phi(-x)=1-\Phi(x),P\{X>\mu_\alpha\}=\alpha,\mu_\alpha为标准正态分布的上侧\alpha分位数 XN(0,1)Φ(0)=21,Φ(x)=1Φ(x),P{X>μα}=α,μαα
X ∼ N ( μ , σ 2 ) ⟹ F ( x ) = Φ ( x − u σ ) a X + b ∼ N ( a μ + b , a 2 σ 2 ) F ( μ − x ) + F ( u + x ) = 1 \begin{aligned} X\sim N(\mu,\sigma^2) \Longrightarrow &F(x)=\Phi(\frac{x-u}{\sigma})\\ &aX+b \sim N(a\mu+b,a^2\sigma^2)\\ &F(\mu-x)+F(u+x)=1 \end{aligned} XN(μ,σ2)F(x)=Φ(σxu)aX+bN(aμ+b,a2σ2)F(μx)+F(u+x)=1

∫ − ∞ + ∞ e − x 2 2 d x = 2 π , ∫ − ∞ + ∞ e − x 2 d x = π \int_{-\infty}^{+\infty}e^{-\frac{x^2}{2}}dx=\sqrt{2\pi},\int_{-\infty}^{+\infty}e^{-x^2}dx=\sqrt{\pi} +e2x2dx=2π ,+ex2dx=π

∑ i = 0 k C m i C n k − i = C m + n k \sum_{i=0}^kC_m^iC_n^{k-i}=C_{m+n}^k i=0kCmiCnki=Cm+nk

一维随机变量函数的分布

X X X为随机变量,函数 y = g ( x ) y=g(x) y=g(x),则以随机变量 X X X作为自变量的函数 Y = g ( X ) Y=g(X) Y=g(X)也是随机变量,称为随机变量 X X X的函数

  • 离散: P { Y = g ( x i ) } = p i P\{Y=g(x_i)\}=p_i P{Y=g(xi)}=pi
  • 连续: F Y ( y ) = P { Y ≤ y } = P { g ( X ) ≤ y } = ∫ g ( X ) ≤ y f X ( x ) d x , f Y ( y ) = F Y ′ ( y ) F_Y(y)=P\{Y \leq y\} = P\{g(X) \leq y\}=\int_{g(X)\leq y}f_X(x)dx,f_Y(y)=F_Y'(y) FY(y)=P{Yy}=P{g(X)y}=g(X)yfX(x)dxfY(y)=FY(y)

多维随机变量及其分布

基本概念

多维随机变量

如果 X 1 , X 2 , . . . , X n X_1,X_2,...,X_n X1,X2,...,Xn是定义在同一个样本空间 Ω \Omega Ω上的 n n n个随机变量,则称 ( X 1 , X 2 , . . . , X n ) (X_1,X_2,...,X_n) (X1,X2,...,Xn) n n n维随机变量或 n n n维随机向量。

多维随机变量的分布函数

联合分布函数:对任意的 n n n个实数 x 1 , x 2 , . . . , x n x_1,x_2,...,x_n x1,x2,...,xn,称 n n n元函数 F ( x 1 , x 2 , . . . , x n ) = P { X 1 ≤ x 1 , X 2 ≤ x 2 , . . . , X n ≤ x n } F(x_1,x_2,...,x_n)=P\{X_1 \leq x_1,X_2 \leq x_2,...,X_n\leq x_n\} F(x1,x2,...,xn)=P{X1x1,X2x2,...,Xnxn} n n n维随机变量的联合分布函数

是联合分布函数的充要条件:单调性、右连续性、有界性、非负性

边缘分布函数

设二维随机变量 ( X , Y ) (X,Y) (X,Y)的联合分布函数为 F ( X , Y ) F(X,Y) F(X,Y),随机变量 X X X Y Y Y的分布函数 F X ( x ) F_X(x) FX(x) F Y ( Y ) F_Y(Y) FY(Y)分别称为 ( X , Y ) (X,Y) (X,Y)关于 X X X和关于 Y Y Y的边缘分布函数。

F X ( x ) = P { X ≤ x } = P { X ≤ x , Y ≤ + ∞ } = F ( x , + ∞ ) F_X(x)=P\{X \leq x\}=P\{X \leq x,Y \leq +\infty\}=F(x,+\infty) FX(x)=P{Xx}=P{Xx,Y+}=F(x,+)

F Y ( y ) = F ( + ∞ , y ) F_Y(y)=F(+\infty,y) FY(y)=F(+,y)

两类二维随机变量

二维离散随机变量二维连续随机变量
概率分布 p i j = P { X = x i , Y = y i } p_{ij}=P\{X=x_i,Y=y_i\} pij=P{X=xi,Y=yi}
联合分布函数 F ( x , y ) = P { X = x i , Y = y j } = ∑ x i ≤ x ∑ y j ≤ y p i j F(x,y)=P\{X=x_i,Y=y_j\}=\sum_{x_i \leq x}\sum_{y_j \leq y}p_{ij} F(x,y)=P{X=xi,Y=yj}=xixyjypij F ( x , y ) = P { X ≤ x , Y ≤ y } = ∫ − ∞ x ∫ − ∞ y f ( u , v ) d u d v F(x,y)=P\{X \leq x,Y \leq y\}=\int_{-\infty}^{x}\int_{-\infty}^{y}f(u,v)dudv F(x,y)=P{Xx,Yy}=xyf(u,v)dudv
P { ( X , Y ) ∈ G } = ∑ ( x i , y j ) ∈ G p i j P\{(X,Y)\in G\}=\sum_{(x_i,y_j)\in G}p_{ij} P{(X,Y)G}=(xi,yj)Gpij P { ( X , Y ) ∈ G } = ∬ G f ( x , y ) d x d y P\{(X,Y)\in G\}=\iint_Gf(x,y)dxdy P{(X,Y)G}=Gf(x,y)dxdy
边缘分布 p i ⋅ = ∑ j = 1 ∞ p i j , p ⋅ j = ∑ i = 1 ∞ p i j p_{i \cdot}=\sum_{j=1}^{\infty}p_{ij},p_{\cdot j}=\sum_{i=1}^{\infty}p_{ij} pi=j=1pij,pj=i=1pij F X ( x ) = ∫ + ∞ x d u ∫ − ∞ + ∞ f ( u , v ) d v , f X ( x ) = ∫ − ∞ + ∞ f ( x , y ) d y F_X(x)=\int_{+\infty}^xdu\int_{-\infty}^{+\infty}f(u,v)dv,f_X(x)=\int_{-\infty}^{+\infty}f(x,y)dy FX(x)=+xdu+f(u,v)dv,fX(x)=+f(x,y)dy
条件分布 P { X = x i ∣ Y = y j } = p i j p ⋅ j P\{X=x_i\mid Y=y_j\}=\frac{p_{ij}}{p_{\cdot j}} P{X=xiY=yj}=pjpij f Y ∣ X ( y ∣ x ) = f ( x , y ) f X ( x ) f_{Y\mid X}(y\mid x)=\frac{f(x,y)}{f_X(x)} fYX(yx)=fX(x)f(x,y)

f ( x , y ) = 1 S D ( x , y ) ∈ D f(x,y)=\frac{1}{S_D}(x,y) \in D f(x,y)=SD1(x,y)D

f ( x , y ) = 1 2 π σ 1 σ 2 1 − ρ 2 exp ⁡ { − 1 2 ( 1 − ρ 2 ) [ ( x − μ 1 σ 1 ) 2 − 2 ρ ( x − μ 1 σ 1 ) ( x − μ 2 σ 2 ) + ( y − μ 2 σ 2 ) 2 ] } , ( X , Y ) ∼ N ( μ 1 , μ 2 , σ 1 2 , σ 2 2 , ρ ) f(x,y)=\frac{1}{2\pi \sigma_1 \sigma_2 \sqrt{1-\rho^2}}\exp\{-\frac{1}{2(1-\rho^2)}[(\frac{x-\mu_1}{\sigma_1})^2-2\rho(\frac{x-\mu_1}{\sigma_1})(\frac{x-\mu_2}{\sigma_2})+(\frac{y-\mu_2}{\sigma_2})^2]\},(X,Y) \sim N(\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,\rho) f(x,y)=2πσ1σ21ρ2 1exp{2(1ρ2)1[(σ1xμ1)22ρ(σ1xμ1)(σ2xμ2)+(σ2yμ2)2]},(X,Y)N(μ1,μ2,σ12,σ22,ρ)

( X 1 , X 2 ) ∼ N ( μ 1 , μ 2 , σ 1 2 , σ 2 2 , ρ ) ⟹ X 1 ∼ N ( μ 1 , σ 1 2 ) , X 2 ∼ N ( μ 2 , σ 2 2 ) X 1 ∼ N ( μ 1 , σ 1 2 ) , X 2 ∼ N ( μ 2 , σ 2 2 ) 且 X 1 , X 2 相 互 独 立 ⟹ ( X 1 , X 2 ) ∼ N ( μ 1 , μ 2 , σ 1 2 , σ 2 2 , 0 ) ( X 1 , X 2 ) ∼ N ⟹ k 1 X 1 + k 2 X 2 ∼ N ( X 1 , X 2 ) ∼ N , Y 1 = a 1 X 1 + a 2 X 2 , Y 2 = b 1 X 1 + b 2 X 2 ⟹ ( Y 1 , Y 2 ) ∼ N ( X 1 , X 2 ) ∼ N , 则 X 1 , X 2 相 互 独 立    ⟺    X 1 , X 2 不 相 关 ( X , Y ) ∼ N ⟹ f X ∣ Y ( X ∣ Y ) ∼ N , f Y ∣ X ( Y ∣ X ) ∼ N \begin{aligned} &(X_1,X_2) \sim N(\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,\rho) \Longrightarrow X_1 \sim N(\mu_1,\sigma_1^2),X_2 \sim N(\mu_2,\sigma_2^2)\\ &X_1 \sim N(\mu_1,\sigma_1^2),X_2 \sim N(\mu_2,\sigma_2^2) 且X_1,X_2相互独立 \Longrightarrow (X_1,X_2) \sim N(\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,0)\\ &(X_1,X_2) \sim N \Longrightarrow k_1X_1+k_2X_2 \sim N\\ &(X_1,X_2) \sim N ,Y_1=a_1X_1+a_2X_2,Y_2=b_1X_1+b_2X_2 \Longrightarrow (Y_1,Y_2) \sim N\\ &(X_1,X_2) \sim N,则X_1,X_2相互独立 \iff X_1,X_2不相关\\ &(X,Y) \sim N \Longrightarrow f_{X|Y}(X|Y)\sim N,f_{Y|X}(Y|X)\sim N \end{aligned} (X1,X2)N(μ1,μ2,σ12,σ22,ρ)X1N(μ1,σ12),X2N(μ2,σ22)X1N(μ1,σ12),X2N(μ2,σ22)X1,X2(X1,X2)N(μ1,μ2,σ12,σ22,0)(X1,X2)Nk1X1+k2X2N(X1,X2)N,Y1=a1X1+a2X2,Y2=b1X1+b2X2(Y1,Y2)N(X1,X2)N,X1,X2X1,X2(X,Y)NfXY(XY)N,fYX(YX)N

随机变量的相互独立性

如果对于任意的 x x x y y y都有 F ( x , y ) = F X ( x ) F Y ( y ) F(x,y)=F_X(x)F_Y(y) F(x,y)=FX(x)FY(y),则 X X X Y Y Y相互独立

P { X = x i , Y = y j } = P { X = x i } P { Y = y j } P\{X=x_i,Y=y_j\}=P\{X=x_i\}P\{Y=y_j\} P{X=xi,Y=yj}=P{X=xi}P{Y=yj}恒成立(离散)

f ( x , y ) = f X ( x ) f Y ( y ) f(x,y)=f_X(x)f_Y(y) f(x,y)=fX(x)fY(y)恒成立(连续)

多维随机变量函数的分布

X X X, Y Y Y是随机变量, g ( x , y ) g(x,y) g(x,y)是二元函数,则 U = g ( x , y ) U=g(x,y) U=g(x,y)也是随机变量

F ( z ) = P { g ( X , Y ) ≤ z } = ∬ g ( x , y ) ≤ z f ( x , y ) d x d y F(z)=P\{g(X,Y) \leq z\}=\iint_{g(x,y)\leq z}f(x,y)dxdy F(z)=P{g(X,Y)z}=g(x,y)zf(x,y)dxdy

名称函数概率密度–积谁不换谁,换完求偏导(加绝对值)
和的分布 Z = X + Y Z=X+Y Z=X+Y f Z ( z ) = ∫ − ∞ + ∞ f ( x , z − x ) d x = ∫ − ∞ + ∞ f ( z − y , y ) d y f_Z(z)=\int_{-\infty}^{+\infty}f(x,z-x)dx=\int_{-\infty}^{+\infty}f(z-y,y)dy fZ(z)=+f(x,zx)dx=+f(zy,y)dy
差的分布 Z = X − Y Z=X-Y Z=XY f Z ( z ) = ∫ − ∞ + ∞ f ( x , x − z ) d x = ∫ − ∞ + ∞ f ( y + z , y ) d y f_Z(z)=\int_{-\infty}^{+\infty}f(x,x-z)dx=\int_{-\infty}^{+\infty}f(y+z,y)dy fZ(z)=+f(x,xz)dx=+f(y+z,y)dy
积的分布 Z = X Y Z=XY Z=XY f Z ( z ) = ∫ − ∞ + ∞ 1 ∣ x ∣ f ( x , z x ) d x = ∫ − ∞ + ∞ 1 ∣ y ∣ f ( z y , y ) d y f_Z(z)=\int_{-\infty}^{+\infty}\frac{1}{\mid x\mid }f(x,\frac{z}{x})dx=\int_{-\infty}^{+\infty}\frac{1}{\mid y\mid }f(\frac{z}{y},y)dy fZ(z)=+x1f(x,xz)dx=+y1f(yz,y)dy
商的分布 Z = X Y Z=\frac{X}{Y} Z=YX f Z ( z ) = ∫ − ∞ + ∞ ∣ y ∣ f ( y z , y ) d y f_Z(z)=\int_{-\infty}^{+\infty}\mid y\mid f(yz,y)dy fZ(z)=+yf(yz,y)dy
最大值 Z = m a x { X , Y } Z=max\{X,Y\} Z=max{X,Y} F m a x ( z ) = F ( z , z ) F_{max}(z)=F(z,z) Fmax(z)=F(z,z)
最小值 Z = m i n { X , Y } Z=min\{X,Y\} Z=min{X,Y} F m i n ( z ) = F X ( z ) + F Y ( z ) − F ( z , z ) F_{min}(z)=F_X(z)+F_Y(z)-F(z,z) Fmin(z)=FX(z)+FY(z)F(z,z)

F m a x ( z ) = [ F ( z ) ] n , f m a x = n [ F ( Z ) ] n − 1 f ( z ) F_{max}(z)=[F(z)]^n,f_{max}=n[F(Z)]^{n-1}f(z) Fmax(z)=[F(z)]n,fmax=n[F(Z)]n1f(z)

F m i n ( z ) = 1 − [ 1 − F ( z ) ] n , f m i n = n [ 1 − F ( Z ) ] n − 1 f ( z ) F_{min}(z)=1-[1-F(z)]^n,f_{min}=n[1-F(Z)]^{n-1}f(z) Fmin(z)=1[1F(z)]n,fmin=n[1F(Z)]n1f(z)

常见分布的可加性

随机变量分布随机变量相加后分布
X ∼ B ( n , p ) , Y ∼ B ( m , p ) X \sim B(n,p),Y\sim B(m,p) XB(n,p),YB(m,p) X + Y ∼ B ( n + m , p ) X+Y\sim B(n+m,p) X+YB(n+m,p)
P ∼ P ( λ 1 ) , Y ∼ P ( λ 2 ) P \sim P(\lambda_1),Y\sim P(\lambda_2) PP(λ1),YP(λ2) X + Y ∼ P ( λ 1 + λ 2 ) X+Y\sim P(\lambda_1+\lambda_2) X+YP(λ1+λ2)
X ∼ N ( μ 1 , σ 1 2 ) , Y ∼ N ( μ 2 , σ 2 2 ) X\sim N(\mu_1,\sigma^2_1),Y\sim N(\mu_2,\sigma^2_2) XN(μ1,σ12),YN(μ2,σ22) X + Y ∼ N ( μ 1 + μ 2 , σ 1 2 + σ 2 2 ) X+Y\sim N(\mu_1+\mu_2,\sigma^2_1+\sigma^2_2) X+YN(μ1+μ2,σ12+σ22)
X ∼ χ 2 ( n ) , Y ∼ χ 2 ( m ) X \sim \chi^2(n),Y \sim \chi^2(m) Xχ2(n),Yχ2(m) X + Y ∼ χ ( n + m ) X+Y \sim \chi(n+m) X+Yχ(n+m)

随机变量的数字特征

数学期望

E X = ∑ i = 1 ∞ x i p i , E [ g ( x ) ] = ∑ i = 1 ∞ g ( x i ) p i E X = ∫ − ∞ + ∞ x f ( x ) d x , E [ g ( x ) ] = ∫ − ∞ + ∞ g ( x ) f ( x ) d x E ( ∑ i = 1 n a i X i ) = ∑ i = 1 n a i E X i E ( ∏ i = 1 n X i ) = ∏ i = 1 n E X i \begin{aligned} &EX=\sum_{i=1}^\infty x_ip_i,E[g(x)]=\sum_{i=1}^\infty g(x_i)p_i\\ &EX=\int_{-\infty}^{+\infty}xf(x)dx,E[g(x)]=\int_{-\infty}^{+\infty}g(x)f(x)dx\\ &E(\sum_{i=1}^na_iX_i)=\sum_{i=1}^na_iEX_i\\ &E(\prod_{i=1}^nX_i)=\prod_{i=1}^nEX_i \end{aligned} EX=i=1xipi,E[g(x)]=i=1g(xi)piEX=+xf(x)dx,E[g(x)]=+g(x)f(x)dxE(i=1naiXi)=i=1naiEXiE(i=1nXi)=i=1nEXi

方差、标准差、切比雪夫不等式

D X = E [ ( X − E X ) 2 ] = E ( X 2 ) − ( E X ) 2 ( 方 差 ) σ ( X ) = D X ( 标 准 差 ) D c = 0 D ( a X + b ) = a 2 D X D ( X ± Y ) = D X + D Y ± 2 C o v ( X , Y ) P { ∣ X − E X ∣ ≥ ε } ≤ D X ε 2 \begin{aligned} &DX=E[(X-EX)^2]=E(X^2)-(EX)^2 & (方差) \\ &\sigma(X)=\sqrt{DX}& (标准差)\\ &Dc=0\\ &D(aX+b)=a^2DX\\ &D(X \pm Y)=DX+DY \pm 2Cov(X,Y)\\ & P\{|X-EX|\geq \varepsilon \}\leq \frac{DX}{\varepsilon^2} \end{aligned} DX=E[(XEX)2]=E(X2)(EX)2σ(X)=DX Dc=0D(aX+b)=a2DXD(X±Y)=DX+DY±2Cov(X,Y)P{XEXε}ε2DX()()

二维随机变量数学期望

E [ g ( X , Y ) ] = ∑ i = 1 ∑ j = 1 g ( x i , y j ) p i j E [ g ( X , Y ) ] = ∫ − ∞ + ∞ ∫ − ∞ + ∞ g ( x , y ) f ( x , y ) d x d y \begin{aligned} &E[g(X,Y)]=\sum_{i=1}\sum_{j=1} g(x_i,y_j)p_{ij}\\ &E[g(X,Y)]=\int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty}g(x,y)f(x,y)dxdy \end{aligned} E[g(X,Y)]=i=1j=1g(xi,yj)pijE[g(X,Y)]=++g(x,y)f(x,y)dxdy

协方差与相关系数

C o v ( X , Y ) = E ( X Y ) − E X E Y E ( X Y ) = { ∑ i ∑ j x i y j P { X = x i , Y = y j } ∫ − ∞ ∞ ∫ − ∞ ∞ x y f ( x , y ) d x d y p X Y = C o v ( X , Y ) D X D Y 相 关 系 数 C o v ( X , Y ) = C o v ( Y , X ) 对 称 性 C o v ( X , X ) = D X C o v ( a X + b , Y ) = a C o v ( X , Y ) C o v ( X 1 + X 2 , Y ) = C o v ( X 1 , Y ) + C o v ( X 2 ) \begin{aligned} &Cov(X,Y)=E(XY)-EXEY\\ & E(XY)=\begin{cases} \sum_{i}\sum_jx_iy_jP\{X=x_i,Y=y_j\}\\ \int_{-\infty}^{\infty}\int_{-\infty}^{\infty}xyf(x,y)dxdy \end{cases}\\ &p_{XY}=\frac{Cov(X,Y)}{\sqrt{DX}\sqrt{DY}} &相关系数\\ &Cov(X,Y)=Cov(Y,X) &对称性\\ &Cov(X,X)=DX\\ &Cov(aX+b,Y)=aCov(X,Y)\\ &Cov(X_1+X_2,Y)=Cov(X_1,Y)+Cov(X_2) \end{aligned} Cov(X,Y)=E(XY)EXEYE(XY)={ijxiyjP{X=xi,Y=yj}xyf(x,y)dxdypXY=DX DY Cov(X,Y)Cov(X,Y)=Cov(Y,X)Cov(X,X)=DXCov(aX+b,Y)=aCov(X,Y)Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2)

卡方分布计算 Γ ( α ) \Gamma(\alpha) Γ(α)

Γ ( α ) = { ∫ 0 + ∞ x α − 1 e − x d x 2 ∫ 0 + ∞ x 2 α − 1 e − x 2 d x Γ ( α + 1 ) = α Γ ( α ) Γ ( n + 1 ) = n ! Γ ( 1 ) = 1 , Γ ( 1 2 ) = π \begin{aligned} &\Gamma(\alpha)= \begin{cases} \int_0^{+\infty}x^{\alpha-1}e^{-x}dx\\ 2\int_0^{+\infty}x^{2\alpha-1}e^{-x^2}dx\\ \end{cases}\\ &\Gamma(\alpha+1)=\alpha\Gamma(\alpha)\\ &\Gamma(n+1)=n!\\ &\Gamma(1)=1,\Gamma(\frac{1}2)=\sqrt{\pi} \end{aligned} Γ(α)={0+xα1exdx20+x2α1ex2dxΓ(α+1)=αΓ(α)Γ(n+1)=n!Γ(1)=1,Γ(21)=π

大数定理与中心极限定理

依概率收敛

设随机变量 X X X与随机变量序列 { X n } \{X_n\} {Xn},如果对于任何 ε > 0 \varepsilon>0 ε>0,有
lim ⁡ n → ∞ P { ∣ X n − X ∣ ≥ ε } = 0 或 lim ⁡ n → ∞ P { ∣ X n − X ∣ < ε } = 1 \lim_{n\rightarrow \infty}P\{|X_n-X|\geq \varepsilon\}=0或\lim_{n\rightarrow \infty}P\{|X_n-X|< \varepsilon\}=1 nlimP{XnXε}=0nlimP{XnX<ε}=1
则称随机变量序列 { X n } \{X_n\} {Xn}依概率收敛于随机变量 X X X,记为
lim ⁡ n → ∞ X n = X ( P ) 或 X n ⟶ P X ( n → ∞ ) \lim_{n \rightarrow \infty}X_n=X(P)或X_n \stackrel{P}{\longrightarrow} X (n \rightarrow\infty) nlimXn=X(P)XnPX(n)

大数定律

大数定律条件内容
切比雪夫大数定律假设 { X n } \{X_n\} {Xn}是相互独立的随机变量序列,如果方差 D X i DX_i DXi存在且一致有上界,即存在常数 C C C,使得 D X i ≤ C DX_i \leq C DXiC都成立,则 { X n } \{X_n\} {Xn}服从大数定律 1 n ∑ i = 1 n X i ⟶ P 1 n ∑ i = 1 n E X i \frac{1}{n}\sum_{i=1}^nX_i\stackrel{P}{\longrightarrow} \frac{1}{n}\sum_{i=1}^nEX_i n1i=1nXiPn1i=1nEXi
伯努利大数定律假设 μ n \mu_n μn n n n重伯努利试验中事件 A A A发生的次数,在每次试验中事件 A A A发生的概率为 p p p,则 μ n n ⟶ P p \frac{\mu_n}{n}\stackrel{P}{\longrightarrow}p nμnPp
辛钦大数定律假设 { X n } \{X_n\} {Xn}是相互独立的随机变量序列,如果 E X i = μ EX_i=\mu EXi=μ存在,则 1 n ∑ i = 1 n X i ⟶ P μ \frac{1}{n}\sum_{i=1}^nX_i\stackrel{P}{\longrightarrow}\mu n1i=1nXiPμ

中心极限定理

中心极限定理条件内容
列德-林德伯格定理假设 { X n } \{X_n\} {Xn}是独立同分布的随机变量序列,如果 E X i = μ , D X i = σ 2 EX_i=\mu,DX_i=\sigma^2 EXi=μ,DXi=σ2存在 ∑ i = 1 n X i ∼ N ( n μ , n σ 2 ) \sum_{i=1}^nX_i \sim N(n\mu,n\sigma^2) i=1nXiN(nμ,nσ2)
利莫夫-拉普拉斯定理假设随机变量 Y n ∼ B ( n , p ) Y_n\sim B(n,p) YnB(n,p) Y n ∼ N ( n p , n p ( 1 − p ) ) Y_n\sim N(np,np(1-p)) YnN(np,np(1p))

数理统计

总体与样本

总体

研究对象的全体称为总体,组成总体的每一个元素称为个体。在对总体进行统计研究时,我们所关心的是表征总体状况的某个(某几个)数量指标 X X X和该指标在总体中的分布情况。我们把总体与随机变量 X X X等同起来,说“总体 X X X”。所谓总体的分布就是指随机变量 X X X的分布

样本

n n n个相互独立且与总体 X X X具有相同概率分布的随机变量 X 1 , X 2 , . . . , X n X_1,X_2,...,X_n X1,X2,...,Xn所组成的整体 ( X 1 , X 2 , . . . , X n ) (X_1,X_2,...,X_n) (X1,X2,...,Xn)称为来自总体 X X X,容量为 n n n的一个简单随机样本,简称样本。一个抽样结果的 n n n个具体数值 ( x 1 , x 2 , . . . , x n ) (x_1,x_2,...,x_n) (x1,x2,...,xn)称为样本 X 1 , X 2 , . . . , X n X_1,X_2,...,X_n X1,X2,...,Xn的一个观测值

样本的分布

总体 X X X的分布函数为 F ( x 1 , x 2 , . . . , x n ) = ∏ i = 1 n F ( x i ) F(x_1,x_2,...,x_n)=\prod_{i=1}^nF(x_i) F(x1,x2,...,xn)=i=1nF(xi)

P { X 1 = x 1 , X 2 = x 2 , . . . , X n = x n } = ∏ i = 1 n P { X i = x i } P\{X_1=x_1,X_2=x_2,...,X_n=x_n\}=\prod_{i=1}^nP\{X_i=x_i\} P{X1=x1,X2=x2,...,Xn=xn}=i=1nP{Xi=xi}

f ( x 1 , x 2 , . . . , x n ) = ∏ i = 1 n f ( x i ) f(x_1,x_2,...,x_n)=\prod_{i=1}^nf(x_i) f(x1,x2,...,xn)=i=1nf(xi)

统计量及其分布

统计量

X 1 , X 2 , . . . , X n X_1,X_2,...,X_n X1,X2,...,Xn为来自总体的一个样本, g ( x 1 , x 2 , . . . , x n ) g(x_1,x_2,...,x_n) g(x1,x2,...,xn) n n n元函数,如果 g g g中不含任何未知参数,则称 g ( X 1 , X 2 , . . . , X n ) g(X_1,X_2,...,X_n) g(X1,X2,...,Xn)为样本 X 1 , X 2 , . . . , X n X_1,X_2,...,X_n X1,X2,...,Xn的一个统计量。若 ( x 1 , x 2 , . . . , x n ) (x_1,x_2,...,x_n) (x1,x2,...,xn)为样本值,则称 g ( x 1 , x 2 , . . . , x n ) g(x_1,x_2,...,x_n) g(x1,x2,...,xn) g ( X 1 , X 2 , . . . , X n ) g(X_1,X_2,...,X_n) g(X1,X2,...,Xn)的观测值

常用统计量

常用统计量计算公式
样本均值 X ‾ = 1 n ∑ i = 1 n X i \overline{X}=\frac{1}{n}\sum_{i=1}^nX_i X=n1i=1nXi
样本方差 S 2 = 1 n − 1 ∑ i = 1 n ( X i − X ‾ ) 2 S^2=\frac{1}{n-1}\sum_{i=1}^n(X_i-\overline{X})^2 S2=n11i=1n(XiX)2
样本标准差 S S S
样本k阶矩 A k = 1 n ∑ i = 1 n X i k A_k=\frac{1}{n}\sum_{i=1}^nX_i^k Ak=n1i=1nXik
样本k阶中心矩 B k = 1 n ∑ i = 1 n ( X i − X ‾ ) k B_k=\frac{1}{n}\sum_{i=1}^n(X_i-\overline{X})^k Bk=n1i=1n(XiX)k
顺序统计量 X ( 1 ) ≤ X ( 2 ) ≤ . . . ≤ X ( n ) , X ( k ) 为 第 k 顺 序 统 计 量 X_{(1)} \leq X_{(2)} \leq ... \leq X_{(n)},X_{(k)}为第k顺序统计量 X(1)X(2)...X(n),X(k)k
常用统计量的性质 E X i = μ , D X i = σ 2 , E X ‾ = E X = μ , D X ‾ = 1 n D X = σ 2 n , E ( S 2 ) = D X EX_i=\mu,DX_i=\sigma^2,E\overline{X}=EX=\mu,D\overline{X}=\frac{1}{n}DX=\frac{\sigma^2}{n},E(S^2)=DX EXi=μ,DXi=σ2,EX=EX=μ,DX=n1DX=nσ2,E(S2)=DX

三大分布

三大分布描述性质
χ 2 \chi^2 χ2若随机变量 X 1 , X 2 , . . . , X n X_1,X_2,...,X_n X1,X2,...,Xn相互独立,且都服从标准正态分布,则随机变量 X = ∑ i = 1 n X i 2 X=\sum_{i=1}^nX_i^2 X=i=1nXi2服从自由度为 n n n χ 2 \chi^2 χ2分布,记为 X ∼ χ 2 ( n ) X \sim \chi^2(n) Xχ2(n) X 1 + X 2 ∼ χ 2 ( n 1 + n 2 ) E X = n D X = 2 n X_1+X_2 \sim\chi^2(n_1+n_2)\\EX=n\\DX=2n X1+X2χ2(n1+n2)EX=nDX=2n
t t t设随机变量 X ∼ N ( 0 , 1 ) , Y ∼ χ 2 ( n ) X \sim N(0,1),Y \sim \chi^2(n) XN(0,1),Yχ2(n), X Y XY XY相互独立,则随机变量 t = X Y / n t=\frac{X}{\sqrt{Y/n}} t=Y/n X服从自由度为 n n n t t t分布,记为 t ∼ t ( n ) t \sim t(n) tt(n) t 1 − α ( n ) = − t α ( n ) t_{1-\alpha}(n)=-t_{\alpha}(n) t1α(n)=tα(n)
F F F若随机变量 X ∼ χ 2 ( n 1 ) , Y ∼ χ 2 ( n 2 ) X \sim \chi^2(n_1),Y \sim \chi^2(n_2) Xχ2(n1),Yχ2(n2),且 X Y XY XY相互独立,则 F = X / n 1 Y / n 2 F=\frac{X/n_1}{Y/n_2} F=Y/n2X/n1服从自由度为 ( n 1 , n 2 ) (n_1,n_2) (n1,n2) F F F分布,记为 F ∼ F ( n 1 , n 2 ) F \sim F(n_1,n_2) FF(n1,n2) 1 F ∼ F ( n 2 , n 1 ) F 1 − α ( n 1 , n 2 ) = 1 F α ( n 2 , n 1 ) \frac{1}{F} \sim F(n_2,n_1) \\F_{1-\alpha}(n_1,n_2)=\frac{1}{F_\alpha(n_2,n_1)} F1F(n2,n1)F1α(n1,n2)=Fα(n2,n1)1
常用结论

X 1 , X 2 , . . . , X n X_1,X_2,...,X_n X1,X2,...,Xn是来自正态总体 N ( μ , σ 2 ) N(\mu,\sigma^2) N(μ,σ2)的一个样本, X ‾ , S 2 \overline{X},S^2 X,S2分别为样本的均值和方差
X ‾ ∼ N ( μ , σ 2 n ) 1 σ 2 ∑ i = 1 n ( X i − μ ) 2 ∼ χ 2 ( n ) ( n − 1 ) S 2 σ 2 = ∑ i = 1 n ( X i − X ‾ σ ) 2 ∼ χ 2 ( n − 1 ) X ‾ 与 S 2 相 互 独 立 , n ( X ‾ − μ ) S ∼ t ( n − 1 ) 上 面 的 进 一 步 , 有 n ( X ‾ − μ ) 2 S 2 ∼ F ( 1 , n − 1 ) ∑ i = 1 n ( X i − X ‾ ) 2 = ∑ i = 1 n X i 2 − n X ‾ \begin{aligned} &\overline{X} \sim N(\mu,\frac{\sigma^2}{n})\\ &\frac{1}{\sigma^2}\sum_{i=1}^n(X_i-\mu)^2 \sim \chi^2(n)\\ &\frac{(n-1)S^2}{\sigma^2}=\sum_{i=1}^n(\frac{X_i-\overline{X}}{\sigma})^2 \sim \chi^2(n-1)\\ &\overline{X}与S^2相互独立,\frac{\sqrt{n}(\overline{X}-\mu)}{S} \sim t(n-1)\\ &上面的进一步,有 \frac{n(\overline{X}-\mu)^2}{S^2} \sim F(1,n-1)\\ &\sum_{i=1}^n(X_i-\overline{X})^2=\sum_{i=1}^nX_i^2-n\overline{X} \end{aligned} XN(μ,nσ2)σ21i=1n(Xiμ)2χ2(n)σ2(n1)S2=i=1n(σXiX)2χ2(n1)XS2Sn (Xμ)t(n1)S2n(Xμ)2F(1,n1)i=1n(XiX)2=i=1nXi2nX

参数的点估计

概念

设总体 X X X的分布函数为 F ( x ; θ ) F(x;\theta) F(x;θ),其中 θ \theta θ是一个未知函参数, X 1 , X 2 , . . . , X n X_1,X_2,...,X_n X1,X2,...,Xn是取自总体 X X X的一个样本。由样本构造一个适当的统计量 θ ^ ( X 1 , X 2 , . . . , X n ) \hat{\theta}(X_1,X_2,...,X_n) θ^(X1,X2,...,Xn)作为参数 θ \theta θ的估计,则称统计量 θ ^ ( X 1 , X 2 , . . . , X n ) \hat{\theta}(X_1,X_2,...,X_n) θ^(X1,X2,...,Xn) θ \theta θ估计量,通常记为 θ ^ = θ ^ ( X 1 , X 2 , . . . , X n ) \hat{\theta}=\hat{\theta}(X_1,X_2,...,X_n) θ^=θ^(X1,X2,...,Xn)

如果 ( x 1 , x 2 , . . . , x n ) (x_1,x_2,...,x_n) (x1,x2,...,xn)是样本的一个观察值,将其带入估计量 θ ^ \hat{\theta} θ^中得值 θ ^ ( x 1 , x 2 , . . . , x n ) \hat{\theta}(x_1,x_2,...,x_n) θ^(x1,x2,...,xn),并且此值作为未知参数 θ \theta θ的近似值,统计中称这个值为未知参数 θ \theta θ估计值

建立一个适当的统计量作为未知参数 θ \theta θ的估计量,并以相应的观察值作为未知参数估计值的问题,称为参数 θ \theta θ点估计问题

方法

  1. 矩估计法

    样本矩=总体矩

    1 n ∑ i = 1 n X i l = E ( X l ) \frac{1}{n}\sum_{i=1}^nX_i^l=E(X^l) n1i=1nXil=E(Xl)

  2. 最大似然估计法

    • 写出样本的似然函数
      L ( θ ) = L ( x 1 , x 2 , . . . , x n ; θ 1 , θ 2 , . . . , θ k ) = ∏ i = 1 n p ( x i ; θ 1 , θ 2 , . . . , θ k ) 或 ∏ i = 1 n f ( x i ; θ 1 , θ 2 , . . . , θ k ) L(\theta)=L(x_1,x_2,...,x_n;\theta_1,\theta_2,...,\theta_k)=\prod_{i=1}^np(x_i;\theta_1,\theta_2,...,\theta_k)或\prod_{i=1}^nf(x_i;\theta_1,\theta_2,...,\theta_k) L(θ)=L(x1,x2,...,xn;θ1,θ2,...,θk)=i=1np(xi;θ1,θ2,...,θk)i=1nf(xi;θ1,θ2,...,θk)

    • L ( θ ) L(\theta) L(θ)的最大值,通过上下界或者求偏导得到最大似然估计
      ∂ L ( θ ) ∂ θ i = 0 或 者 ∂ ln ⁡ L ( θ ) ∂ θ i = 0 \frac{\partial L(\theta)}{\partial\theta_i}=0 或者\frac{\partial \ln L(\theta)}{\partial\theta_i}=0 θiL(θ)=0θilnL(θ)=0

估计量的评价标准

评价定义
无偏移 E θ ^ = θ E\hat{\theta}=\theta Eθ^=θ
有效性 θ 1 , θ 2 \theta_1,\theta_2 θ1θ2都具有无偏性, D ( θ 1 ^ ) < D ( θ 2 ^ ) D(\hat{\theta_1}) <D(\hat{\theta_2}) D(θ1^)<D(θ2^),则称 θ 1 ^ \hat{\theta_1} θ1^更有效
一致性如果对任意 lim ⁡ n → ∞ P { ∣ θ ^ − θ ∣ < ε } = 1 \lim_{n \rightarrow \infty}P\{\mid \hat{\theta}-\theta\mid <\varepsilon\}=1 limnP{θ^θ<ε}=1

参数的区间估计

θ \theta θ是总体 X X X的一个未知参数,对于给定 α \alpha α,如果由样本 X 1 , X 2 , . . . , X n X_1,X_2,...,X_n X1,X2,...,Xn确定的两个统计量 θ 1 ^ = θ 1 ^ ( X 1 , X 2 , . . . , X n ) \hat{\theta_1}=\hat{\theta_1}(X_1,X_2,...,X_n) θ1^=θ1^(X1,X2,...,Xn), θ 2 ^ = θ 2 ^ ( X 1 , X 2 , . . . , X n ) \hat{\theta_2}=\hat{\theta_2}(X_1,X_2,...,X_n) θ2^=θ2^(X1,X2,...,Xn),使 P { θ 1 ^ ( X 1 , X 2 , . . . , X n ) < θ < θ 2 ^ ( X 1 , X 2 , . . . , X n ) } = 1 − α P\{\hat{\theta_1}(X_1,X_2,...,X_n) < \theta < \hat{\theta_2}(X_1,X_2,...,X_n)\}=1-\alpha P{θ1^(X1,X2,...,Xn)<θ<θ2^(X1,X2,...,Xn)}=1α

则称随机区间 ( θ 1 ^ , θ 2 ^ ) (\hat{\theta_1},\hat{\theta_2}) (θ1^,θ2^) θ ^ \hat{\theta} θ^置信度为 1 − α 1-\alpha 1α的置信区间, θ 1 ^ \hat{\theta_1} θ1^ θ 2 ^ \hat{\theta_2} θ2^分别称为 θ \theta θ的置信度为 1 − α 1-\alpha 1α的双侧置信区间的置信下限置信上限 1 − α 1-\alpha 1α称为置信度置信水平, α \alpha α称为显著性水平犯第一类错误的概率保护 H 0 H_0 H0的概率

正态总体均值的置信区间
待估参数其他参数枢轴量的分布置信区间
μ \mu μ σ 2 \sigma^2 σ2已知 Z = X ‾ − μ σ / n ∼ N ( 0 , 1 ) Z=\frac{\overline{X}-\mu}{\sigma/\sqrt{n}}\sim N(0,1) Z=σ/n XμN(0,1) ( X ‾ ± σ n z α / 2 ) (\overline{X}\pm \frac{\sigma}{\sqrt{n}}z_{\alpha/2}) (X±n σzα/2)
μ \mu μ σ 2 \sigma^2 σ2未知 t = X ‾ − μ S / n ∼ t ( n − 1 ) t=\frac{\overline{X}-\mu}{S/\sqrt{n}}\sim t(n-1) t=S/n Xμt(n1) ( X ‾ ± S n t α / 2 ( n − 1 ) ) (\overline{X}\pm \frac{S}{\sqrt{n}}t_{\alpha/2}(n-1)) (X±n Stα/2(n1))

若提“单侧置信限”,把 α 2 \frac \alpha{2} 2α改写成 α \alpha α即可

假设检验

在统计假设中,对假设进行检验。原问题称为原假设 H 0 H_0 H0,其否定称述为对立假设 H 1 H_1 H1。对原假设作出否定或不否定的推论,称为对 H 0 H_0 H0的显著性检验。使用的思想是小概率事件为假

在假设检验中,由拒接原假设 H 0 H_0 H0的全体样本点所组成的集合 C C C称为否定域 C C C的补集称为 H 0 H_0 H0的接受域

假设检验要求原假设中带等号

正态总体下的六大检验及拒绝域
σ 2 \sigma^2 σ2 u u u H 0 H_0 H0统计量拒绝域
已知未知 μ = μ 0 \mu=\mu_0 μ=μ0 Z = X ‾ − μ σ / n Z=\frac{\overline{X}-\mu}{\sigma/\sqrt{n}} Z=σ/n Xμ ∣ z ∣ ≥ z α / 2 \mid z\mid \geq z_{\alpha/2} zzα/2
未知未知 μ = μ 0 \mu=\mu_0 μ=μ0 T = X ‾ − μ S / n T=\frac{\overline{X}-\mu}{S/\sqrt{n}} T=S/n Xμ ∣ t ∣ ≥ t α / 2 ( n − 1 ) \mid t\mid \geq t_{\alpha/2}(n-1) ttα/2(n1)
已知未知 μ ≤ μ 0 \mu \leq \mu_0 μμ0 Z = X ‾ − μ σ / n Z=\frac{\overline{X}-\mu}{\sigma/\sqrt{n}} Z=σ/n Xμ z ≥ z α z \geq z_\alpha zzα
已知未知 μ ≥ μ 0 \mu \geq \mu_0 μμ0 Z = X ‾ − μ σ / n Z=\frac{\overline{X}-\mu}{\sigma/\sqrt{n}} Z=σ/n Xμ z ≤ − z α z \leq -z_\alpha zzα
未知未知 μ ≤ μ 0 \mu \leq \mu_0 μμ0 T = X ‾ − μ S / n T=\frac{\overline{X}-\mu}{S/\sqrt{n}} T=S/n Xμ t ≥ t α ( n − 1 ) t \geq t_{\alpha}(n-1) ttα(n1)
未知未知 μ ≥ μ 0 \mu \geq \mu_0 μμ0 T = X ‾ − μ S / n T=\frac{\overline{X}-\mu}{S/\sqrt{n}} T=S/n Xμ t ≤ t α ( n − 1 ) t \leq t_{\alpha}(n-1) ttα(n1)

两类错误

两类错误描述发生概率例子
第一类错误:弃真 H 0 H_0 H0为正,按检验法则,否定 H 0 H_0 H0,此时犯了弃真错误。 α = P { 拒 绝 H 0 ∣ H 0 为 真 } \alpha=P\{拒绝H_0\mid H_0为真\} α=P{H0H0}有病判无病
第二类错误:取伪 H 0 H_0 H0不真,按检验法则,接受 H 0 H_0 H0,此时犯了取伪错误。 β = P { 接 受 H 0 ∣ H 0 为 假 } \beta=P\{接受H_0\mid H_0为假\} β=P{H0H0}无病判有病
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

愤怒的卤蛋

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值