随机事件与概率
基本概念
随机试验
- 试验可以在相同的条件下重复进行
- 试验所有可能结果是明确可知道的,并且不止一个
- 每一次试验会出现哪一个结果,事先并不确定
事件
- 随机事件 A , B , C . . . A,B,C... A,B,C...
- 必然事件 Ω \Omega Ω
- 不可能事件 ∅ \varnothing ∅
样本空间
- 样本点:随机试验的每一个可能结果称为样本点,记为 ω \omega ω
- 样本空间:样本点的全体组成的集合称为样本空间,记为 Ω \Omega Ω
- 基本事件:由一个样本点构成的事件称为基本事件
- 随机事件 A A A是由若干个基本事件组成的
概率
-
描述性定义
通常将随机事件 A A A发生的可能性大小的度量,称为事件 A A A发生的概率,记为 P ( A ) P(A) P(A)
-
统计性定义
在相同条件下做重复实验,事件 A A A出现的次数k和总的实验次数 n n n之比 k n \frac{k}{n} nk,称为事件 A A A在这 n n n次试验中出现的频率。当试验次数 n n n充分大时,频率将稳定于某常数 p p p的附近。 n n n越大,频率偏离这个常数 p p p的可能性越小。这个常数 p p p就称为事件 A A A的概率
-
公理化定义
设随机试验的样本空间为 Ω \Omega Ω,如果对每一个事件 A A A都有一个确定的实数 P ( A ) P(A) P(A),且事件函数 P ( ⋅ ) P(\cdot) P(⋅)满足:
- 非负性: P ( A ) ≥ 0 P(A) \geq0 P(A)≥0
- 规范性: P ( Ω ) = 1 P(\Omega) = 1 P(Ω)=1
- 可列可加性:对于任意可列个互不相容的事件 P ( ∪ i = 1 n A i ) = ∑ i = 1 ∞ P ( A i ) P(\cup_{i=1}^nA_i)=\sum_{i=1}^{\infty}P(A_i) P(∪i=1nAi)=∑i=1∞P(Ai)
则称 P ( ⋅ ) P(\cdot) P(⋅)为概率, P ( A ) P(A) P(A)为事件 A A A的概率
事件的独立性和独立重复实验
事件的独立性
P ( A B ) = P ( A ) P ( B ) P(AB)=P(A)P(B) P(AB)=P(A)P(B),则 A B AB AB相互独立, A B AB AB代表一个事件或几个事件。只判断两个基本事件独立只能说明是两两独立,想证明相互独立需要多维判断
试验的独立性
各个试验结果是相互独立的
独立试验序列概型
在相同条件下独立重复进行完全相同的试验,每次实验结果相关结果概率相同
n重伯努利概型
只有两个结果 A A A与 A ‾ \overline{A} A的试验重复 n n n次
事件的关系和运算
概念 | 定义 |
---|---|
和 | A ∪ B A \cup B A∪B |
积 | A ∩ B A \cap B A∩B |
差 | A − B = A − A B = A B ‾ A-B=A-AB=A\overline{B} A−B=A−AB=AB |
包含 | A ⊂ B A \subset B A⊂B |
相等 | A = B ⟺ A ⊂ B & B ⊂ A A=B \iff A \subset B \& B \subset A A=B⟺A⊂B&B⊂A |
相容 | A B = ∅ AB=\varnothing AB=∅ |
互斥 | A B ≠ ∅ AB \neq \varnothing AB=∅ |
对立 | A ‾ \overline{A} A |
完备事件组 | ∪ i = 1 n A i = Ω , A i A j = ∅ \cup_{i=1}^nA_i=\Omega,A_iA_j= \varnothing ∪i=1nAi=Ω,AiAj=∅ |
运算法则 | 吸收律、交换律、结合律、分配律、对偶律 |
运算顺序 | 先逆再交后并差 |
概率的基本性质与公式
名称 | 公式 |
---|---|
有界性 | 0 ≤ P ( A ) ≤ 1 , P ( ∅ ) = 0 , P ( Ω ) = 1 0 \leq P(A) \leq 1,P(\varnothing)=0,P(\Omega)=1 0≤P(A)≤1,P(∅)=0,P(Ω)=1 |
单调性 | A ⊂ B ⇒ P ( B − A ) = P ( B ) − P ( A ) , P ( B ) ≥ P ( A ) A \subset B \Rightarrow P(B-A)=P(B)-P(A),P(B) \geq P(A) A⊂B⇒P(B−A)=P(B)−P(A),P(B)≥P(A) |
逆事件概率 | P ( A ‾ ) = 1 − P ( A ) P(\overline{A})=1-P(A) P(A)=1−P(A) |
加法 | P ( A ∪ B ) = P ( A ) + P ( B ) − P ( A B ) = P ( A B ) + P ( A B ‾ ) + P ( B A ‾ ) P(A\cup B)=P(A)+P(B)-P(AB)=P(AB)+P(A\overline{B})+P(B\overline{A}) P(A∪B)=P(A)+P(B)−P(AB)=P(AB)+P(AB)+P(BA) |
加法三维 | P ( A ∪ B ∪ C ) = P ( A ) + P ( B ) + P ( C ) − P ( A B ) − P ( A C ) − P ( B C ) + P ( A B C ) P(A\cup B \cup C)=P(A)+P(B)+P(C)-P(AB)-P(AC)-P(BC)+P(ABC) P(A∪B∪C)=P(A)+P(B)+P(C)−P(AB)−P(AC)−P(BC)+P(ABC) |
减法 | P ( A − B ) = P ( A ) − P ( A B ) = P ( A B ‾ ) P(A-B)=P(A)-P(AB)=P(A\overline B) P(A−B)=P(A)−P(AB)=P(AB) |
条件概率 | P ( B ∣ A ) = P ( A B ) P ( A ) P(B\mid A)=\frac{P(AB)}{P(A)} P(B∣A)=P(A)P(AB) |
乘法 | P ( A B ) = P ( A ) P ( B ∣ A ) P(AB)=P(A)P(B\mid A) P(AB)=P(A)P(B∣A) |
多维乘法 | P ( A 1 A 2 . . . A n ) = P ( A 1 ) P ( A 2 ∣ A 1 ) P ( A 3 ∣ A 1 A 2 ) . . . P ( A n ∣ A 1 A 2 . . . A n − 1 ) P(A_1A_2...A_n)=P(A_1)P(A_2\mid A_1)P(A_3\mid A_1A_2)...P(A_n\mid A_1A_2...A_{n-1}) P(A1A2...An)=P(A1)P(A2∣A1)P(A3∣A1A2)...P(An∣A1A2...An−1) |
全概率公式 | ∪ i = 1 n A i = Ω , A i A j = ∅ ⇒ B = ∪ i = 1 n A i B , P ( B ) = ∑ i = 1 n P ( A i ) P ( B ∣ A i ) \cup_{i=1}^nA_i=\Omega,A_iA_j= \varnothing \Rightarrow B=\cup_{i=1}^nA_iB,P(B)=\sum_{i=1}^nP(A_i)P(B\mid A_i) ∪i=1nAi=Ω,AiAj=∅⇒B=∪i=1nAiB,P(B)=∑i=1nP(Ai)P(B∣Ai) |
贝叶斯公式 | ∪ i = 1 n A i = Ω , A i A j = ∅ ⇒ P ( A j ∣ B ) = P ( A j ) P ( B ∣ A j ) ∑ i = 1 n P ( A i ) P ( B ∣ A i ) \cup_{i=1}^nA_i=\Omega,A_iA_j= \varnothing \Rightarrow P(A_j\mid B)=\frac{P(A_j)P(B\mid A_j)}{\sum_{i=1}^nP(A_i)P(B\mid A_i)} ∪i=1nAi=Ω,AiAj=∅⇒P(Aj∣B)=∑i=1nP(Ai)P(B∣Ai)P(Aj)P(B∣Aj) |
古典概型和几何概型
要素 | 古典概型 | 几何概型 |
---|---|---|
定义 | 基本事件有限、等可能 | 基本事件无限且具有几何度量、等可能 |
概率计算 | P ( A ) = k n P(A)=\frac{k}{n} P(A)=nk | P ( A ) = S A S Ω P(A)=\frac{S_A}{S_\Omega} P(A)=SΩSA |
一维随机变量及其分布
随机变量
随机变量就是“其值会随机而定”的变量。设随机试验 E E E的样本空间为 Ω = ω \Omega={\omega} Ω=ω,如果对每一个 ω \omega ω,如果对每一个 ω ∈ Ω \omega \in \Omega ω∈Ω,都有唯一的实数 X ( ω ) X(\omega) X(ω)与之对应,并且对任意实数 x x x, { ω ∣ X ( ω ) ≤ x , ω ∈ Ω } \{\omega\mid X(\omega) \leq x,\omega \in \Omega\} {ω∣X(ω)≤x,ω∈Ω}是随机事件,则称定义在 Ω \Omega Ω上的实值单值函数 X ( ω ) X(\omega) X(ω)为随机变量。简记为 X X X
分布函数
设 X X X是随机变量, x x x是任意实数,称函数 F ( x ) = P { X ≤ x } F(x)=P\{X \leq x\} F(x)=P{X≤x}为随机变量 X X X的分布函数,或称 X X X服从分布 F ( x ) F(x) F(x),记为 X ∼ F ( x ) X\sim F(x) X∼F(x)
性质 | 公式 |
---|---|
F ( x ) F(x) F(x)单调不减 | x 1 < x 2 ⇒ F ( x 1 ) ≤ F ( x 2 ) x_1<x_2\Rightarrow F(x_1) \leq F(x_2) x1<x2⇒F(x1)≤F(x2) |
F ( x ) F(x) F(x)是右连续的 | lim x → x 0 + F ( x ) = F ( x 0 + 0 ) = F ( x 0 ) \lim_{x \rightarrow x_0^+}F(x)=F(x_0+0)=F(x_0) limx→x0+F(x)=F(x0+0)=F(x0) |
上下界 | F ( − ∞ ) = lim x → − ∞ = 0 , F ( + ∞ ) = lim x → + ∞ = 1 F(-\infty)=\lim_{x\rightarrow -\infty}=0,F(+\infty)=\lim_{x\rightarrow +\infty}=1 F(−∞)=limx→−∞=0,F(+∞)=limx→+∞=1 |
计算 | P { X ≤ a } = F ( a ) P { X < a } = F ( a − 0 ) P { X = a } = F ( a ) − F ( a − 0 ) P\{X \leq a\}=F(a)\\P\{X < a\}=F(a-0)\\P\{X = a\}=F(a)-F(a-0) P{X≤a}=F(a)P{X<a}=F(a−0)P{X=a}=F(a)−F(a−0) |
离散型随机变量和连续型随机变量
对比 | 离散随机变量 | 连续随机变量 |
---|---|---|
描述 | P { X = x i } = p i P\{X=x_i\}=p_i P{X=xi}=pi | F ( x ) = ∫ − ∞ x f ( t ) d t F(x)=\int_{-\infty}^xf(t)dt F(x)=∫−∞xf(t)dt |
概念 | P { X = x i } = p i P\{X=x_i\}=p_i P{X=xi}=pi为 X X X的分布列、分布律、概率分布 | f ( x ) f(x) f(x)为 X X X的概率密度函数 |
表示 | 表格或矩阵 | |
特性1 | P { X = x i } = P { X ≤ x i } − P { X < x i } = F ( x i ) − F ( x i − 0 ) P\{X=x_i\}=P\{X \leq x_i\}-P\{X<x_i\}=F(x_i)-F(x_i-0) P{X=xi}=P{X≤xi}−P{X<xi}=F(xi)−F(xi−0) | P { X = c } = 0 P\{X=c\}=0 P{X=c}=0 |
特性2 | P { X ∈ B } = ∑ x i ∈ B P { X = x i } P\{X\in B\}=\sum_{x_i \in B}P\{X=x_i\} P{X∈B}=∑xi∈BP{X=xi} | P { X ∈ B } = ∫ B f ( x ) d x P\{X\in B\}=\int_Bf(x)dx P{X∈B}=∫Bf(x)dx |
特性3 | P { a < X ≤ b } = P { X ≤ b } − P { X ≤ a } = F ( b ) − F ( a ) P\{a<X\leq b\}=P\{X\leq b\}-P\{X\leq a\}=F(b)-F(a) P{a<X≤b}=P{X≤b}−P{X≤a}=F(b)−F(a) | P { a < X < b } = P { a ≤ X < b } = P { a < X ≤ b } = P { a ≤ X ≤ b } = ∫ a b f ( x ) d x = F ( b ) − F ( a ) P\{a<X<b\}=P\{a\leq X <b\}\\=P\{a<X\leq b\}=P\{a\leq X \leq b\}\\=\int_a^bf(x)dx=F(b)-F(a) P{a<X<b}=P{a≤X<b}=P{a<X≤b}=P{a≤X≤b}=∫abf(x)dx=F(b)−F(a) |
常见的随机变量分布类型
分布名称 | 符号 | 定义 | 期望 | 方差 |
---|---|---|---|---|
0 − 1 0-1 0−1分布 | B ( 1 , p ) B(1,p) B(1,p) | P { X = 1 } = p , P { X = 0 } = 1 − p P\{X=1\}=p,P\{X=0\}=1-p P{X=1}=p,P{X=0}=1−p | p p p | p ( 1 − p ) p(1-p) p(1−p) |
二项分布 | B ( n , p ) B(n,p) B(n,p) | P { X = k } = C n k p k ( 1 − p ) n − k P\{X=k\}=C_n^kp^k(1-p)^{n-k} P{X=k}=Cnkpk(1−p)n−k | n p np np | n p ( 1 − p ) np(1-p) np(1−p) |
几何分布 | G ( P ) G(P) G(P) | P { X = k } = ( 1 − p ) k − 1 p P\{X=k\}=(1-p)^{k-1}p P{X=k}=(1−p)k−1p | 1 p \frac{1}{p} p1 | 1 − p p 2 \frac{1-p}{p^2} p21−p |
超几何分布 | H ( n , N , M ) H(n,N,M) H(n,N,M) | P { X = k } = C M k C N M n − k C N n P\{X=k\}=\frac{C_M^kC_{N_M}^{n-k}}{C_N^n} P{X=k}=CNnCMkCNMn−k | n M N \frac{nM}{N} NnM | |
泊松分布 | P ( λ ) P(\lambda) P(λ) | P { X = k } = λ k k ! e − λ P\{X=k\}=\frac{\lambda^k}{k!}e^{-\lambda} P{X=k}=k!λke−λ | λ \lambda λ | λ \lambda λ |
均匀分布 | U ( a , b ) U(a,b) U(a,b) | f ( x ) = 1 b − a ( a < x < b ) , e l s e = 0 f(x)=\frac{1}{b-a}(a<x<b),else =0 f(x)=b−a1(a<x<b),else=0 | a + b 2 \frac{a+b}{2} 2a+b | ( b − a ) 2 12 \frac{(b-a)^2}{12} 12(b−a)2 |
指数分布 | E ( λ ) E(\lambda) E(λ) | f ( x ) = λ e − λ x ( x > 0 ) , e l s e = 0 f(x)=\lambda e^{-\lambda x}(x>0),else =0 f(x)=λe−λx(x>0),else=0 | 1 λ \frac{1}{\lambda} λ1 | 1 λ 2 \frac{1}{\lambda^2} λ21 |
正态分布 | N ( μ , σ 2 ) N(\mu,\sigma^2) N(μ,σ2) | f ( x ) = 1 2 π σ e − 1 2 ( x − u σ ) 2 f(x)=\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{1}{2}(\frac{x-u}{\sigma})^2} f(x)=2πσ1e−21(σx−u)2 | μ \mu μ | σ 2 \sigma^2 σ2 |
标准正态分布 | N ( 0 , 1 ) N(0,1) N(0,1) | φ ( x ) = 1 2 π e − 1 2 x 2 , \varphi(x)=\frac{1}{\sqrt{2\pi}}e^{-\frac{1}{2}x^2}, φ(x)=2π1e−21x2, | 0 0 0 | 1 1 1 |
泊松分布
某时间段和场合下,源源不断的随机质点流的个数
泊松定理
若
X
∼
B
(
n
,
p
)
X \sim B(n,p)
X∼B(n,p),当
n
n
n很大,
p
p
p很小时,用泊松分布公式逼近二项分布效果比较好,二项分布可用泊松分布近似表示
C
n
k
p
k
(
1
−
p
)
n
−
k
≈
λ
k
k
!
e
−
λ
(
λ
=
n
p
)
C_n^kp^k(1-p)^{n-k} \approx \frac{\lambda^k}{k!}e^{-\lambda}(\lambda = np)
Cnkpk(1−p)n−k≈k!λke−λ(λ=np)
特别当
n
≥
20
,
p
≤
0.05
n \geq20,p \leq 0.05
n≥20,p≤0.05时,用泊松近似公式逼近二项分布效果比较好,特别当
n
≥
100
,
n
p
≤
10
n \geq 100,np \leq 10
n≥100,np≤10时,逼近效果更佳
有关正态分布的特性
X
∼
N
(
0
,
1
)
⇒
Φ
(
0
)
=
1
2
,
Φ
(
−
x
)
=
1
−
Φ
(
x
)
,
P
{
X
>
μ
α
}
=
α
,
μ
α
为
标
准
正
态
分
布
的
上
侧
α
分
位
数
X \sim N(0,1) \Rightarrow \Phi(0)=\frac{1}{2},\Phi(-x)=1-\Phi(x),P\{X>\mu_\alpha\}=\alpha,\mu_\alpha为标准正态分布的上侧\alpha分位数
X∼N(0,1)⇒Φ(0)=21,Φ(−x)=1−Φ(x),P{X>μα}=α,μα为标准正态分布的上侧α分位数
X
∼
N
(
μ
,
σ
2
)
⟹
F
(
x
)
=
Φ
(
x
−
u
σ
)
a
X
+
b
∼
N
(
a
μ
+
b
,
a
2
σ
2
)
F
(
μ
−
x
)
+
F
(
u
+
x
)
=
1
\begin{aligned} X\sim N(\mu,\sigma^2) \Longrightarrow &F(x)=\Phi(\frac{x-u}{\sigma})\\ &aX+b \sim N(a\mu+b,a^2\sigma^2)\\ &F(\mu-x)+F(u+x)=1 \end{aligned}
X∼N(μ,σ2)⟹F(x)=Φ(σx−u)aX+b∼N(aμ+b,a2σ2)F(μ−x)+F(u+x)=1
∫ − ∞ + ∞ e − x 2 2 d x = 2 π , ∫ − ∞ + ∞ e − x 2 d x = π \int_{-\infty}^{+\infty}e^{-\frac{x^2}{2}}dx=\sqrt{2\pi},\int_{-\infty}^{+\infty}e^{-x^2}dx=\sqrt{\pi} ∫−∞+∞e−2x2dx=2π,∫−∞+∞e−x2dx=π
∑ i = 0 k C m i C n k − i = C m + n k \sum_{i=0}^kC_m^iC_n^{k-i}=C_{m+n}^k ∑i=0kCmiCnk−i=Cm+nk
一维随机变量函数的分布
设 X X X为随机变量,函数 y = g ( x ) y=g(x) y=g(x),则以随机变量 X X X作为自变量的函数 Y = g ( X ) Y=g(X) Y=g(X)也是随机变量,称为随机变量 X X X的函数
- 离散: P { Y = g ( x i ) } = p i P\{Y=g(x_i)\}=p_i P{Y=g(xi)}=pi
- 连续: F Y ( y ) = P { Y ≤ y } = P { g ( X ) ≤ y } = ∫ g ( X ) ≤ y f X ( x ) d x , f Y ( y ) = F Y ′ ( y ) F_Y(y)=P\{Y \leq y\} = P\{g(X) \leq y\}=\int_{g(X)\leq y}f_X(x)dx,f_Y(y)=F_Y'(y) FY(y)=P{Y≤y}=P{g(X)≤y}=∫g(X)≤yfX(x)dx,fY(y)=FY′(y)
多维随机变量及其分布
基本概念
多维随机变量
如果 X 1 , X 2 , . . . , X n X_1,X_2,...,X_n X1,X2,...,Xn是定义在同一个样本空间 Ω \Omega Ω上的 n n n个随机变量,则称 ( X 1 , X 2 , . . . , X n ) (X_1,X_2,...,X_n) (X1,X2,...,Xn)为 n n n维随机变量或 n n n维随机向量。
多维随机变量的分布函数
联合分布函数:对任意的 n n n个实数 x 1 , x 2 , . . . , x n x_1,x_2,...,x_n x1,x2,...,xn,称 n n n元函数 F ( x 1 , x 2 , . . . , x n ) = P { X 1 ≤ x 1 , X 2 ≤ x 2 , . . . , X n ≤ x n } F(x_1,x_2,...,x_n)=P\{X_1 \leq x_1,X_2 \leq x_2,...,X_n\leq x_n\} F(x1,x2,...,xn)=P{X1≤x1,X2≤x2,...,Xn≤xn}为 n n n维随机变量的联合分布函数
是联合分布函数的充要条件:单调性、右连续性、有界性、非负性
边缘分布函数
设二维随机变量 ( X , Y ) (X,Y) (X,Y)的联合分布函数为 F ( X , Y ) F(X,Y) F(X,Y),随机变量 X X X与 Y Y Y的分布函数 F X ( x ) F_X(x) FX(x)与 F Y ( Y ) F_Y(Y) FY(Y)分别称为 ( X , Y ) (X,Y) (X,Y)关于 X X X和关于 Y Y Y的边缘分布函数。
F X ( x ) = P { X ≤ x } = P { X ≤ x , Y ≤ + ∞ } = F ( x , + ∞ ) F_X(x)=P\{X \leq x\}=P\{X \leq x,Y \leq +\infty\}=F(x,+\infty) FX(x)=P{X≤x}=P{X≤x,Y≤+∞}=F(x,+∞)
F Y ( y ) = F ( + ∞ , y ) F_Y(y)=F(+\infty,y) FY(y)=F(+∞,y)
两类二维随机变量
二维离散随机变量 | 二维连续随机变量 | |
---|---|---|
概率分布 | p i j = P { X = x i , Y = y i } p_{ij}=P\{X=x_i,Y=y_i\} pij=P{X=xi,Y=yi} | |
联合分布函数 | F ( x , y ) = P { X = x i , Y = y j } = ∑ x i ≤ x ∑ y j ≤ y p i j F(x,y)=P\{X=x_i,Y=y_j\}=\sum_{x_i \leq x}\sum_{y_j \leq y}p_{ij} F(x,y)=P{X=xi,Y=yj}=∑xi≤x∑yj≤ypij | F ( x , y ) = P { X ≤ x , Y ≤ y } = ∫ − ∞ x ∫ − ∞ y f ( u , v ) d u d v F(x,y)=P\{X \leq x,Y \leq y\}=\int_{-\infty}^{x}\int_{-\infty}^{y}f(u,v)dudv F(x,y)=P{X≤x,Y≤y}=∫−∞x∫−∞yf(u,v)dudv |
P { ( X , Y ) ∈ G } = ∑ ( x i , y j ) ∈ G p i j P\{(X,Y)\in G\}=\sum_{(x_i,y_j)\in G}p_{ij} P{(X,Y)∈G}=∑(xi,yj)∈Gpij | P { ( X , Y ) ∈ G } = ∬ G f ( x , y ) d x d y P\{(X,Y)\in G\}=\iint_Gf(x,y)dxdy P{(X,Y)∈G}=∬Gf(x,y)dxdy | |
边缘分布 | p i ⋅ = ∑ j = 1 ∞ p i j , p ⋅ j = ∑ i = 1 ∞ p i j p_{i \cdot}=\sum_{j=1}^{\infty}p_{ij},p_{\cdot j}=\sum_{i=1}^{\infty}p_{ij} pi⋅=∑j=1∞pij,p⋅j=∑i=1∞pij | F X ( x ) = ∫ + ∞ x d u ∫ − ∞ + ∞ f ( u , v ) d v , f X ( x ) = ∫ − ∞ + ∞ f ( x , y ) d y F_X(x)=\int_{+\infty}^xdu\int_{-\infty}^{+\infty}f(u,v)dv,f_X(x)=\int_{-\infty}^{+\infty}f(x,y)dy FX(x)=∫+∞xdu∫−∞+∞f(u,v)dv,fX(x)=∫−∞+∞f(x,y)dy |
条件分布 | P { X = x i ∣ Y = y j } = p i j p ⋅ j P\{X=x_i\mid Y=y_j\}=\frac{p_{ij}}{p_{\cdot j}} P{X=xi∣Y=yj}=p⋅jpij | f Y ∣ X ( y ∣ x ) = f ( x , y ) f X ( x ) f_{Y\mid X}(y\mid x)=\frac{f(x,y)}{f_X(x)} fY∣X(y∣x)=fX(x)f(x,y) |
f ( x , y ) = 1 S D ( x , y ) ∈ D f(x,y)=\frac{1}{S_D}(x,y) \in D f(x,y)=SD1(x,y)∈D
f ( x , y ) = 1 2 π σ 1 σ 2 1 − ρ 2 exp { − 1 2 ( 1 − ρ 2 ) [ ( x − μ 1 σ 1 ) 2 − 2 ρ ( x − μ 1 σ 1 ) ( x − μ 2 σ 2 ) + ( y − μ 2 σ 2 ) 2 ] } , ( X , Y ) ∼ N ( μ 1 , μ 2 , σ 1 2 , σ 2 2 , ρ ) f(x,y)=\frac{1}{2\pi \sigma_1 \sigma_2 \sqrt{1-\rho^2}}\exp\{-\frac{1}{2(1-\rho^2)}[(\frac{x-\mu_1}{\sigma_1})^2-2\rho(\frac{x-\mu_1}{\sigma_1})(\frac{x-\mu_2}{\sigma_2})+(\frac{y-\mu_2}{\sigma_2})^2]\},(X,Y) \sim N(\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,\rho) f(x,y)=2πσ1σ21−ρ21exp{−2(1−ρ2)1[(σ1x−μ1)2−2ρ(σ1x−μ1)(σ2x−μ2)+(σ2y−μ2)2]},(X,Y)∼N(μ1,μ2,σ12,σ22,ρ)
( X 1 , X 2 ) ∼ N ( μ 1 , μ 2 , σ 1 2 , σ 2 2 , ρ ) ⟹ X 1 ∼ N ( μ 1 , σ 1 2 ) , X 2 ∼ N ( μ 2 , σ 2 2 ) X 1 ∼ N ( μ 1 , σ 1 2 ) , X 2 ∼ N ( μ 2 , σ 2 2 ) 且 X 1 , X 2 相 互 独 立 ⟹ ( X 1 , X 2 ) ∼ N ( μ 1 , μ 2 , σ 1 2 , σ 2 2 , 0 ) ( X 1 , X 2 ) ∼ N ⟹ k 1 X 1 + k 2 X 2 ∼ N ( X 1 , X 2 ) ∼ N , Y 1 = a 1 X 1 + a 2 X 2 , Y 2 = b 1 X 1 + b 2 X 2 ⟹ ( Y 1 , Y 2 ) ∼ N ( X 1 , X 2 ) ∼ N , 则 X 1 , X 2 相 互 独 立 ⟺ X 1 , X 2 不 相 关 ( X , Y ) ∼ N ⟹ f X ∣ Y ( X ∣ Y ) ∼ N , f Y ∣ X ( Y ∣ X ) ∼ N \begin{aligned} &(X_1,X_2) \sim N(\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,\rho) \Longrightarrow X_1 \sim N(\mu_1,\sigma_1^2),X_2 \sim N(\mu_2,\sigma_2^2)\\ &X_1 \sim N(\mu_1,\sigma_1^2),X_2 \sim N(\mu_2,\sigma_2^2) 且X_1,X_2相互独立 \Longrightarrow (X_1,X_2) \sim N(\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,0)\\ &(X_1,X_2) \sim N \Longrightarrow k_1X_1+k_2X_2 \sim N\\ &(X_1,X_2) \sim N ,Y_1=a_1X_1+a_2X_2,Y_2=b_1X_1+b_2X_2 \Longrightarrow (Y_1,Y_2) \sim N\\ &(X_1,X_2) \sim N,则X_1,X_2相互独立 \iff X_1,X_2不相关\\ &(X,Y) \sim N \Longrightarrow f_{X|Y}(X|Y)\sim N,f_{Y|X}(Y|X)\sim N \end{aligned} (X1,X2)∼N(μ1,μ2,σ12,σ22,ρ)⟹X1∼N(μ1,σ12),X2∼N(μ2,σ22)X1∼N(μ1,σ12),X2∼N(μ2,σ22)且X1,X2相互独立⟹(X1,X2)∼N(μ1,μ2,σ12,σ22,0)(X1,X2)∼N⟹k1X1+k2X2∼N(X1,X2)∼N,Y1=a1X1+a2X2,Y2=b1X1+b2X2⟹(Y1,Y2)∼N(X1,X2)∼N,则X1,X2相互独立⟺X1,X2不相关(X,Y)∼N⟹fX∣Y(X∣Y)∼N,fY∣X(Y∣X)∼N
随机变量的相互独立性
如果对于任意的 x x x, y y y都有 F ( x , y ) = F X ( x ) F Y ( y ) F(x,y)=F_X(x)F_Y(y) F(x,y)=FX(x)FY(y),则 X X X与 Y Y Y相互独立
P { X = x i , Y = y j } = P { X = x i } P { Y = y j } P\{X=x_i,Y=y_j\}=P\{X=x_i\}P\{Y=y_j\} P{X=xi,Y=yj}=P{X=xi}P{Y=yj}恒成立(离散)
f ( x , y ) = f X ( x ) f Y ( y ) f(x,y)=f_X(x)f_Y(y) f(x,y)=fX(x)fY(y)恒成立(连续)
多维随机变量函数的分布
设 X X X, Y Y Y是随机变量, g ( x , y ) g(x,y) g(x,y)是二元函数,则 U = g ( x , y ) U=g(x,y) U=g(x,y)也是随机变量
F ( z ) = P { g ( X , Y ) ≤ z } = ∬ g ( x , y ) ≤ z f ( x , y ) d x d y F(z)=P\{g(X,Y) \leq z\}=\iint_{g(x,y)\leq z}f(x,y)dxdy F(z)=P{g(X,Y)≤z}=∬g(x,y)≤zf(x,y)dxdy
名称 | 函数 | 概率密度–积谁不换谁,换完求偏导(加绝对值) |
---|---|---|
和的分布 | Z = X + Y Z=X+Y Z=X+Y | f Z ( z ) = ∫ − ∞ + ∞ f ( x , z − x ) d x = ∫ − ∞ + ∞ f ( z − y , y ) d y f_Z(z)=\int_{-\infty}^{+\infty}f(x,z-x)dx=\int_{-\infty}^{+\infty}f(z-y,y)dy fZ(z)=∫−∞+∞f(x,z−x)dx=∫−∞+∞f(z−y,y)dy |
差的分布 | Z = X − Y Z=X-Y Z=X−Y | f Z ( z ) = ∫ − ∞ + ∞ f ( x , x − z ) d x = ∫ − ∞ + ∞ f ( y + z , y ) d y f_Z(z)=\int_{-\infty}^{+\infty}f(x,x-z)dx=\int_{-\infty}^{+\infty}f(y+z,y)dy fZ(z)=∫−∞+∞f(x,x−z)dx=∫−∞+∞f(y+z,y)dy |
积的分布 | Z = X Y Z=XY Z=XY | f Z ( z ) = ∫ − ∞ + ∞ 1 ∣ x ∣ f ( x , z x ) d x = ∫ − ∞ + ∞ 1 ∣ y ∣ f ( z y , y ) d y f_Z(z)=\int_{-\infty}^{+\infty}\frac{1}{\mid x\mid }f(x,\frac{z}{x})dx=\int_{-\infty}^{+\infty}\frac{1}{\mid y\mid }f(\frac{z}{y},y)dy fZ(z)=∫−∞+∞∣x∣1f(x,xz)dx=∫−∞+∞∣y∣1f(yz,y)dy |
商的分布 | Z = X Y Z=\frac{X}{Y} Z=YX | f Z ( z ) = ∫ − ∞ + ∞ ∣ y ∣ f ( y z , y ) d y f_Z(z)=\int_{-\infty}^{+\infty}\mid y\mid f(yz,y)dy fZ(z)=∫−∞+∞∣y∣f(yz,y)dy |
最大值 | Z = m a x { X , Y } Z=max\{X,Y\} Z=max{X,Y} | F m a x ( z ) = F ( z , z ) F_{max}(z)=F(z,z) Fmax(z)=F(z,z) |
最小值 | Z = m i n { X , Y } Z=min\{X,Y\} Z=min{X,Y} | F m i n ( z ) = F X ( z ) + F Y ( z ) − F ( z , z ) F_{min}(z)=F_X(z)+F_Y(z)-F(z,z) Fmin(z)=FX(z)+FY(z)−F(z,z) |
F m a x ( z ) = [ F ( z ) ] n , f m a x = n [ F ( Z ) ] n − 1 f ( z ) F_{max}(z)=[F(z)]^n,f_{max}=n[F(Z)]^{n-1}f(z) Fmax(z)=[F(z)]n,fmax=n[F(Z)]n−1f(z)
F m i n ( z ) = 1 − [ 1 − F ( z ) ] n , f m i n = n [ 1 − F ( Z ) ] n − 1 f ( z ) F_{min}(z)=1-[1-F(z)]^n,f_{min}=n[1-F(Z)]^{n-1}f(z) Fmin(z)=1−[1−F(z)]n,fmin=n[1−F(Z)]n−1f(z)
常见分布的可加性
随机变量分布 | 随机变量相加后分布 |
---|---|
X ∼ B ( n , p ) , Y ∼ B ( m , p ) X \sim B(n,p),Y\sim B(m,p) X∼B(n,p),Y∼B(m,p) | X + Y ∼ B ( n + m , p ) X+Y\sim B(n+m,p) X+Y∼B(n+m,p) |
P ∼ P ( λ 1 ) , Y ∼ P ( λ 2 ) P \sim P(\lambda_1),Y\sim P(\lambda_2) P∼P(λ1),Y∼P(λ2) | X + Y ∼ P ( λ 1 + λ 2 ) X+Y\sim P(\lambda_1+\lambda_2) X+Y∼P(λ1+λ2) |
X ∼ N ( μ 1 , σ 1 2 ) , Y ∼ N ( μ 2 , σ 2 2 ) X\sim N(\mu_1,\sigma^2_1),Y\sim N(\mu_2,\sigma^2_2) X∼N(μ1,σ12),Y∼N(μ2,σ22) | X + Y ∼ N ( μ 1 + μ 2 , σ 1 2 + σ 2 2 ) X+Y\sim N(\mu_1+\mu_2,\sigma^2_1+\sigma^2_2) X+Y∼N(μ1+μ2,σ12+σ22) |
X ∼ χ 2 ( n ) , Y ∼ χ 2 ( m ) X \sim \chi^2(n),Y \sim \chi^2(m) X∼χ2(n),Y∼χ2(m) | X + Y ∼ χ ( n + m ) X+Y \sim \chi(n+m) X+Y∼χ(n+m) |
随机变量的数字特征
数学期望
E X = ∑ i = 1 ∞ x i p i , E [ g ( x ) ] = ∑ i = 1 ∞ g ( x i ) p i E X = ∫ − ∞ + ∞ x f ( x ) d x , E [ g ( x ) ] = ∫ − ∞ + ∞ g ( x ) f ( x ) d x E ( ∑ i = 1 n a i X i ) = ∑ i = 1 n a i E X i E ( ∏ i = 1 n X i ) = ∏ i = 1 n E X i \begin{aligned} &EX=\sum_{i=1}^\infty x_ip_i,E[g(x)]=\sum_{i=1}^\infty g(x_i)p_i\\ &EX=\int_{-\infty}^{+\infty}xf(x)dx,E[g(x)]=\int_{-\infty}^{+\infty}g(x)f(x)dx\\ &E(\sum_{i=1}^na_iX_i)=\sum_{i=1}^na_iEX_i\\ &E(\prod_{i=1}^nX_i)=\prod_{i=1}^nEX_i \end{aligned} EX=i=1∑∞xipi,E[g(x)]=i=1∑∞g(xi)piEX=∫−∞+∞xf(x)dx,E[g(x)]=∫−∞+∞g(x)f(x)dxE(i=1∑naiXi)=i=1∑naiEXiE(i=1∏nXi)=i=1∏nEXi
方差、标准差、切比雪夫不等式
D X = E [ ( X − E X ) 2 ] = E ( X 2 ) − ( E X ) 2 ( 方 差 ) σ ( X ) = D X ( 标 准 差 ) D c = 0 D ( a X + b ) = a 2 D X D ( X ± Y ) = D X + D Y ± 2 C o v ( X , Y ) P { ∣ X − E X ∣ ≥ ε } ≤ D X ε 2 \begin{aligned} &DX=E[(X-EX)^2]=E(X^2)-(EX)^2 & (方差) \\ &\sigma(X)=\sqrt{DX}& (标准差)\\ &Dc=0\\ &D(aX+b)=a^2DX\\ &D(X \pm Y)=DX+DY \pm 2Cov(X,Y)\\ & P\{|X-EX|\geq \varepsilon \}\leq \frac{DX}{\varepsilon^2} \end{aligned} DX=E[(X−EX)2]=E(X2)−(EX)2σ(X)=DXDc=0D(aX+b)=a2DXD(X±Y)=DX+DY±2Cov(X,Y)P{∣X−EX∣≥ε}≤ε2DX(方差)(标准差)
二维随机变量数学期望
E [ g ( X , Y ) ] = ∑ i = 1 ∑ j = 1 g ( x i , y j ) p i j E [ g ( X , Y ) ] = ∫ − ∞ + ∞ ∫ − ∞ + ∞ g ( x , y ) f ( x , y ) d x d y \begin{aligned} &E[g(X,Y)]=\sum_{i=1}\sum_{j=1} g(x_i,y_j)p_{ij}\\ &E[g(X,Y)]=\int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty}g(x,y)f(x,y)dxdy \end{aligned} E[g(X,Y)]=i=1∑j=1∑g(xi,yj)pijE[g(X,Y)]=∫−∞+∞∫−∞+∞g(x,y)f(x,y)dxdy
协方差与相关系数
C o v ( X , Y ) = E ( X Y ) − E X E Y E ( X Y ) = { ∑ i ∑ j x i y j P { X = x i , Y = y j } ∫ − ∞ ∞ ∫ − ∞ ∞ x y f ( x , y ) d x d y p X Y = C o v ( X , Y ) D X D Y 相 关 系 数 C o v ( X , Y ) = C o v ( Y , X ) 对 称 性 C o v ( X , X ) = D X C o v ( a X + b , Y ) = a C o v ( X , Y ) C o v ( X 1 + X 2 , Y ) = C o v ( X 1 , Y ) + C o v ( X 2 ) \begin{aligned} &Cov(X,Y)=E(XY)-EXEY\\ & E(XY)=\begin{cases} \sum_{i}\sum_jx_iy_jP\{X=x_i,Y=y_j\}\\ \int_{-\infty}^{\infty}\int_{-\infty}^{\infty}xyf(x,y)dxdy \end{cases}\\ &p_{XY}=\frac{Cov(X,Y)}{\sqrt{DX}\sqrt{DY}} &相关系数\\ &Cov(X,Y)=Cov(Y,X) &对称性\\ &Cov(X,X)=DX\\ &Cov(aX+b,Y)=aCov(X,Y)\\ &Cov(X_1+X_2,Y)=Cov(X_1,Y)+Cov(X_2) \end{aligned} Cov(X,Y)=E(XY)−EXEYE(XY)={∑i∑jxiyjP{X=xi,Y=yj}∫−∞∞∫−∞∞xyf(x,y)dxdypXY=DXDYCov(X,Y)Cov(X,Y)=Cov(Y,X)Cov(X,X)=DXCov(aX+b,Y)=aCov(X,Y)Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2)相关系数对称性
卡方分布计算 Γ ( α ) \Gamma(\alpha) Γ(α)
Γ ( α ) = { ∫ 0 + ∞ x α − 1 e − x d x 2 ∫ 0 + ∞ x 2 α − 1 e − x 2 d x Γ ( α + 1 ) = α Γ ( α ) Γ ( n + 1 ) = n ! Γ ( 1 ) = 1 , Γ ( 1 2 ) = π \begin{aligned} &\Gamma(\alpha)= \begin{cases} \int_0^{+\infty}x^{\alpha-1}e^{-x}dx\\ 2\int_0^{+\infty}x^{2\alpha-1}e^{-x^2}dx\\ \end{cases}\\ &\Gamma(\alpha+1)=\alpha\Gamma(\alpha)\\ &\Gamma(n+1)=n!\\ &\Gamma(1)=1,\Gamma(\frac{1}2)=\sqrt{\pi} \end{aligned} Γ(α)={∫0+∞xα−1e−xdx2∫0+∞x2α−1e−x2dxΓ(α+1)=αΓ(α)Γ(n+1)=n!Γ(1)=1,Γ(21)=π
大数定理与中心极限定理
依概率收敛
设随机变量
X
X
X与随机变量序列
{
X
n
}
\{X_n\}
{Xn},如果对于任何
ε
>
0
\varepsilon>0
ε>0,有
lim
n
→
∞
P
{
∣
X
n
−
X
∣
≥
ε
}
=
0
或
lim
n
→
∞
P
{
∣
X
n
−
X
∣
<
ε
}
=
1
\lim_{n\rightarrow \infty}P\{|X_n-X|\geq \varepsilon\}=0或\lim_{n\rightarrow \infty}P\{|X_n-X|< \varepsilon\}=1
n→∞limP{∣Xn−X∣≥ε}=0或n→∞limP{∣Xn−X∣<ε}=1
则称随机变量序列
{
X
n
}
\{X_n\}
{Xn}依概率收敛于随机变量
X
X
X,记为
lim
n
→
∞
X
n
=
X
(
P
)
或
X
n
⟶
P
X
(
n
→
∞
)
\lim_{n \rightarrow \infty}X_n=X(P)或X_n \stackrel{P}{\longrightarrow} X (n \rightarrow\infty)
n→∞limXn=X(P)或Xn⟶PX(n→∞)
大数定律
大数定律 | 条件 | 内容 |
---|---|---|
切比雪夫大数定律 | 假设 { X n } \{X_n\} {Xn}是相互独立的随机变量序列,如果方差 D X i DX_i DXi存在且一致有上界,即存在常数 C C C,使得 D X i ≤ C DX_i \leq C DXi≤C都成立,则 { X n } \{X_n\} {Xn}服从大数定律 | 1 n ∑ i = 1 n X i ⟶ P 1 n ∑ i = 1 n E X i \frac{1}{n}\sum_{i=1}^nX_i\stackrel{P}{\longrightarrow} \frac{1}{n}\sum_{i=1}^nEX_i n1∑i=1nXi⟶Pn1∑i=1nEXi |
伯努利大数定律 | 假设 μ n \mu_n μn是 n n n重伯努利试验中事件 A A A发生的次数,在每次试验中事件 A A A发生的概率为 p p p,则 | μ n n ⟶ P p \frac{\mu_n}{n}\stackrel{P}{\longrightarrow}p nμn⟶Pp |
辛钦大数定律 | 假设 { X n } \{X_n\} {Xn}是相互独立的随机变量序列,如果 E X i = μ EX_i=\mu EXi=μ存在,则 | 1 n ∑ i = 1 n X i ⟶ P μ \frac{1}{n}\sum_{i=1}^nX_i\stackrel{P}{\longrightarrow}\mu n1∑i=1nXi⟶Pμ |
中心极限定理
中心极限定理 | 条件 | 内容 |
---|---|---|
列德-林德伯格定理 | 假设 { X n } \{X_n\} {Xn}是独立同分布的随机变量序列,如果 E X i = μ , D X i = σ 2 EX_i=\mu,DX_i=\sigma^2 EXi=μ,DXi=σ2存在 | ∑ i = 1 n X i ∼ N ( n μ , n σ 2 ) \sum_{i=1}^nX_i \sim N(n\mu,n\sigma^2) ∑i=1nXi∼N(nμ,nσ2) |
利莫夫-拉普拉斯定理 | 假设随机变量 Y n ∼ B ( n , p ) Y_n\sim B(n,p) Yn∼B(n,p) | Y n ∼ N ( n p , n p ( 1 − p ) ) Y_n\sim N(np,np(1-p)) Yn∼N(np,np(1−p)) |
数理统计
总体与样本
总体
研究对象的全体称为总体,组成总体的每一个元素称为个体。在对总体进行统计研究时,我们所关心的是表征总体状况的某个(某几个)数量指标 X X X和该指标在总体中的分布情况。我们把总体与随机变量 X X X等同起来,说“总体 X X X”。所谓总体的分布就是指随机变量 X X X的分布
样本
n n n个相互独立且与总体 X X X具有相同概率分布的随机变量 X 1 , X 2 , . . . , X n X_1,X_2,...,X_n X1,X2,...,Xn所组成的整体 ( X 1 , X 2 , . . . , X n ) (X_1,X_2,...,X_n) (X1,X2,...,Xn)称为来自总体 X X X,容量为 n n n的一个简单随机样本,简称样本。一个抽样结果的 n n n个具体数值 ( x 1 , x 2 , . . . , x n ) (x_1,x_2,...,x_n) (x1,x2,...,xn)称为样本 X 1 , X 2 , . . . , X n X_1,X_2,...,X_n X1,X2,...,Xn的一个观测值
样本的分布
总体 X X X的分布函数为 F ( x 1 , x 2 , . . . , x n ) = ∏ i = 1 n F ( x i ) F(x_1,x_2,...,x_n)=\prod_{i=1}^nF(x_i) F(x1,x2,...,xn)=∏i=1nF(xi)
P { X 1 = x 1 , X 2 = x 2 , . . . , X n = x n } = ∏ i = 1 n P { X i = x i } P\{X_1=x_1,X_2=x_2,...,X_n=x_n\}=\prod_{i=1}^nP\{X_i=x_i\} P{X1=x1,X2=x2,...,Xn=xn}=∏i=1nP{Xi=xi}
f ( x 1 , x 2 , . . . , x n ) = ∏ i = 1 n f ( x i ) f(x_1,x_2,...,x_n)=\prod_{i=1}^nf(x_i) f(x1,x2,...,xn)=∏i=1nf(xi)
统计量及其分布
统计量
设 X 1 , X 2 , . . . , X n X_1,X_2,...,X_n X1,X2,...,Xn为来自总体的一个样本, g ( x 1 , x 2 , . . . , x n ) g(x_1,x_2,...,x_n) g(x1,x2,...,xn)为 n n n元函数,如果 g g g中不含任何未知参数,则称 g ( X 1 , X 2 , . . . , X n ) g(X_1,X_2,...,X_n) g(X1,X2,...,Xn)为样本 X 1 , X 2 , . . . , X n X_1,X_2,...,X_n X1,X2,...,Xn的一个统计量。若 ( x 1 , x 2 , . . . , x n ) (x_1,x_2,...,x_n) (x1,x2,...,xn)为样本值,则称 g ( x 1 , x 2 , . . . , x n ) g(x_1,x_2,...,x_n) g(x1,x2,...,xn)为 g ( X 1 , X 2 , . . . , X n ) g(X_1,X_2,...,X_n) g(X1,X2,...,Xn)的观测值
常用统计量
常用统计量 | 计算公式 |
---|---|
样本均值 | X ‾ = 1 n ∑ i = 1 n X i \overline{X}=\frac{1}{n}\sum_{i=1}^nX_i X=n1∑i=1nXi |
样本方差 | S 2 = 1 n − 1 ∑ i = 1 n ( X i − X ‾ ) 2 S^2=\frac{1}{n-1}\sum_{i=1}^n(X_i-\overline{X})^2 S2=n−11∑i=1n(Xi−X)2 |
样本标准差 | S S S |
样本k阶矩 | A k = 1 n ∑ i = 1 n X i k A_k=\frac{1}{n}\sum_{i=1}^nX_i^k Ak=n1∑i=1nXik |
样本k阶中心矩 | B k = 1 n ∑ i = 1 n ( X i − X ‾ ) k B_k=\frac{1}{n}\sum_{i=1}^n(X_i-\overline{X})^k Bk=n1∑i=1n(Xi−X)k |
顺序统计量 | X ( 1 ) ≤ X ( 2 ) ≤ . . . ≤ X ( n ) , X ( k ) 为 第 k 顺 序 统 计 量 X_{(1)} \leq X_{(2)} \leq ... \leq X_{(n)},X_{(k)}为第k顺序统计量 X(1)≤X(2)≤...≤X(n),X(k)为第k顺序统计量 |
常用统计量的性质 | E X i = μ , D X i = σ 2 , E X ‾ = E X = μ , D X ‾ = 1 n D X = σ 2 n , E ( S 2 ) = D X EX_i=\mu,DX_i=\sigma^2,E\overline{X}=EX=\mu,D\overline{X}=\frac{1}{n}DX=\frac{\sigma^2}{n},E(S^2)=DX EXi=μ,DXi=σ2,EX=EX=μ,DX=n1DX=nσ2,E(S2)=DX |
三大分布
三大分布 | 描述 | 性质 |
---|---|---|
χ 2 \chi^2 χ2 | 若随机变量 X 1 , X 2 , . . . , X n X_1,X_2,...,X_n X1,X2,...,Xn相互独立,且都服从标准正态分布,则随机变量 X = ∑ i = 1 n X i 2 X=\sum_{i=1}^nX_i^2 X=∑i=1nXi2服从自由度为 n n n的 χ 2 \chi^2 χ2分布,记为 X ∼ χ 2 ( n ) X \sim \chi^2(n) X∼χ2(n) | X 1 + X 2 ∼ χ 2 ( n 1 + n 2 ) E X = n D X = 2 n X_1+X_2 \sim\chi^2(n_1+n_2)\\EX=n\\DX=2n X1+X2∼χ2(n1+n2)EX=nDX=2n |
t t t | 设随机变量 X ∼ N ( 0 , 1 ) , Y ∼ χ 2 ( n ) X \sim N(0,1),Y \sim \chi^2(n) X∼N(0,1),Y∼χ2(n), X Y XY XY相互独立,则随机变量 t = X Y / n t=\frac{X}{\sqrt{Y/n}} t=Y/nX服从自由度为 n n n的 t t t分布,记为 t ∼ t ( n ) t \sim t(n) t∼t(n) | t 1 − α ( n ) = − t α ( n ) t_{1-\alpha}(n)=-t_{\alpha}(n) t1−α(n)=−tα(n) |
F F F | 若随机变量 X ∼ χ 2 ( n 1 ) , Y ∼ χ 2 ( n 2 ) X \sim \chi^2(n_1),Y \sim \chi^2(n_2) X∼χ2(n1),Y∼χ2(n2),且 X Y XY XY相互独立,则 F = X / n 1 Y / n 2 F=\frac{X/n_1}{Y/n_2} F=Y/n2X/n1服从自由度为 ( n 1 , n 2 ) (n_1,n_2) (n1,n2)的 F F F分布,记为 F ∼ F ( n 1 , n 2 ) F \sim F(n_1,n_2) F∼F(n1,n2) | 1 F ∼ F ( n 2 , n 1 ) F 1 − α ( n 1 , n 2 ) = 1 F α ( n 2 , n 1 ) \frac{1}{F} \sim F(n_2,n_1) \\F_{1-\alpha}(n_1,n_2)=\frac{1}{F_\alpha(n_2,n_1)} F1∼F(n2,n1)F1−α(n1,n2)=Fα(n2,n1)1 |
常用结论
设
X
1
,
X
2
,
.
.
.
,
X
n
X_1,X_2,...,X_n
X1,X2,...,Xn是来自正态总体
N
(
μ
,
σ
2
)
N(\mu,\sigma^2)
N(μ,σ2)的一个样本,
X
‾
,
S
2
\overline{X},S^2
X,S2分别为样本的均值和方差
X
‾
∼
N
(
μ
,
σ
2
n
)
1
σ
2
∑
i
=
1
n
(
X
i
−
μ
)
2
∼
χ
2
(
n
)
(
n
−
1
)
S
2
σ
2
=
∑
i
=
1
n
(
X
i
−
X
‾
σ
)
2
∼
χ
2
(
n
−
1
)
X
‾
与
S
2
相
互
独
立
,
n
(
X
‾
−
μ
)
S
∼
t
(
n
−
1
)
上
面
的
进
一
步
,
有
n
(
X
‾
−
μ
)
2
S
2
∼
F
(
1
,
n
−
1
)
∑
i
=
1
n
(
X
i
−
X
‾
)
2
=
∑
i
=
1
n
X
i
2
−
n
X
‾
\begin{aligned} &\overline{X} \sim N(\mu,\frac{\sigma^2}{n})\\ &\frac{1}{\sigma^2}\sum_{i=1}^n(X_i-\mu)^2 \sim \chi^2(n)\\ &\frac{(n-1)S^2}{\sigma^2}=\sum_{i=1}^n(\frac{X_i-\overline{X}}{\sigma})^2 \sim \chi^2(n-1)\\ &\overline{X}与S^2相互独立,\frac{\sqrt{n}(\overline{X}-\mu)}{S} \sim t(n-1)\\ &上面的进一步,有 \frac{n(\overline{X}-\mu)^2}{S^2} \sim F(1,n-1)\\ &\sum_{i=1}^n(X_i-\overline{X})^2=\sum_{i=1}^nX_i^2-n\overline{X} \end{aligned}
X∼N(μ,nσ2)σ21i=1∑n(Xi−μ)2∼χ2(n)σ2(n−1)S2=i=1∑n(σXi−X)2∼χ2(n−1)X与S2相互独立,Sn(X−μ)∼t(n−1)上面的进一步,有S2n(X−μ)2∼F(1,n−1)i=1∑n(Xi−X)2=i=1∑nXi2−nX
参数的点估计
概念
设总体 X X X的分布函数为 F ( x ; θ ) F(x;\theta) F(x;θ),其中 θ \theta θ是一个未知函参数, X 1 , X 2 , . . . , X n X_1,X_2,...,X_n X1,X2,...,Xn是取自总体 X X X的一个样本。由样本构造一个适当的统计量 θ ^ ( X 1 , X 2 , . . . , X n ) \hat{\theta}(X_1,X_2,...,X_n) θ^(X1,X2,...,Xn)作为参数 θ \theta θ的估计,则称统计量 θ ^ ( X 1 , X 2 , . . . , X n ) \hat{\theta}(X_1,X_2,...,X_n) θ^(X1,X2,...,Xn)为 θ \theta θ的估计量,通常记为 θ ^ = θ ^ ( X 1 , X 2 , . . . , X n ) \hat{\theta}=\hat{\theta}(X_1,X_2,...,X_n) θ^=θ^(X1,X2,...,Xn)
如果 ( x 1 , x 2 , . . . , x n ) (x_1,x_2,...,x_n) (x1,x2,...,xn)是样本的一个观察值,将其带入估计量 θ ^ \hat{\theta} θ^中得值 θ ^ ( x 1 , x 2 , . . . , x n ) \hat{\theta}(x_1,x_2,...,x_n) θ^(x1,x2,...,xn),并且此值作为未知参数 θ \theta θ的近似值,统计中称这个值为未知参数 θ \theta θ的估计值
建立一个适当的统计量作为未知参数 θ \theta θ的估计量,并以相应的观察值作为未知参数估计值的问题,称为参数 θ \theta θ的点估计问题
方法
-
矩估计法
样本矩=总体矩
1 n ∑ i = 1 n X i l = E ( X l ) \frac{1}{n}\sum_{i=1}^nX_i^l=E(X^l) n1∑i=1nXil=E(Xl)
-
最大似然估计法
-
写出样本的似然函数
L ( θ ) = L ( x 1 , x 2 , . . . , x n ; θ 1 , θ 2 , . . . , θ k ) = ∏ i = 1 n p ( x i ; θ 1 , θ 2 , . . . , θ k ) 或 ∏ i = 1 n f ( x i ; θ 1 , θ 2 , . . . , θ k ) L(\theta)=L(x_1,x_2,...,x_n;\theta_1,\theta_2,...,\theta_k)=\prod_{i=1}^np(x_i;\theta_1,\theta_2,...,\theta_k)或\prod_{i=1}^nf(x_i;\theta_1,\theta_2,...,\theta_k) L(θ)=L(x1,x2,...,xn;θ1,θ2,...,θk)=i=1∏np(xi;θ1,θ2,...,θk)或i=1∏nf(xi;θ1,θ2,...,θk) -
求 L ( θ ) L(\theta) L(θ)的最大值,通过上下界或者求偏导得到最大似然估计
∂ L ( θ ) ∂ θ i = 0 或 者 ∂ ln L ( θ ) ∂ θ i = 0 \frac{\partial L(\theta)}{\partial\theta_i}=0 或者\frac{\partial \ln L(\theta)}{\partial\theta_i}=0 ∂θi∂L(θ)=0或者∂θi∂lnL(θ)=0
-
估计量的评价标准
评价 | 定义 |
---|---|
无偏移 | E θ ^ = θ E\hat{\theta}=\theta Eθ^=θ |
有效性 | 在 θ 1 , θ 2 \theta_1,\theta_2 θ1,θ2都具有无偏性, D ( θ 1 ^ ) < D ( θ 2 ^ ) D(\hat{\theta_1}) <D(\hat{\theta_2}) D(θ1^)<D(θ2^),则称 θ 1 ^ \hat{\theta_1} θ1^更有效 |
一致性 | 如果对任意 lim n → ∞ P { ∣ θ ^ − θ ∣ < ε } = 1 \lim_{n \rightarrow \infty}P\{\mid \hat{\theta}-\theta\mid <\varepsilon\}=1 limn→∞P{∣θ^−θ∣<ε}=1 |
参数的区间估计
设 θ \theta θ是总体 X X X的一个未知参数,对于给定 α \alpha α,如果由样本 X 1 , X 2 , . . . , X n X_1,X_2,...,X_n X1,X2,...,Xn确定的两个统计量 θ 1 ^ = θ 1 ^ ( X 1 , X 2 , . . . , X n ) \hat{\theta_1}=\hat{\theta_1}(X_1,X_2,...,X_n) θ1^=θ1^(X1,X2,...,Xn), θ 2 ^ = θ 2 ^ ( X 1 , X 2 , . . . , X n ) \hat{\theta_2}=\hat{\theta_2}(X_1,X_2,...,X_n) θ2^=θ2^(X1,X2,...,Xn),使 P { θ 1 ^ ( X 1 , X 2 , . . . , X n ) < θ < θ 2 ^ ( X 1 , X 2 , . . . , X n ) } = 1 − α P\{\hat{\theta_1}(X_1,X_2,...,X_n) < \theta < \hat{\theta_2}(X_1,X_2,...,X_n)\}=1-\alpha P{θ1^(X1,X2,...,Xn)<θ<θ2^(X1,X2,...,Xn)}=1−α
则称随机区间 ( θ 1 ^ , θ 2 ^ ) (\hat{\theta_1},\hat{\theta_2}) (θ1^,θ2^)是 θ ^ \hat{\theta} θ^置信度为 1 − α 1-\alpha 1−α的置信区间, θ 1 ^ \hat{\theta_1} θ1^和 θ 2 ^ \hat{\theta_2} θ2^分别称为 θ \theta θ的置信度为 1 − α 1-\alpha 1−α的双侧置信区间的置信下限和置信上限, 1 − α 1-\alpha 1−α称为置信度或置信水平, α \alpha α称为显著性水平或犯第一类错误的概率或保护 H 0 H_0 H0的概率
正态总体均值的置信区间
待估参数 | 其他参数 | 枢轴量的分布 | 置信区间 |
---|---|---|---|
μ \mu μ | σ 2 \sigma^2 σ2已知 | Z = X ‾ − μ σ / n ∼ N ( 0 , 1 ) Z=\frac{\overline{X}-\mu}{\sigma/\sqrt{n}}\sim N(0,1) Z=σ/nX−μ∼N(0,1) | ( X ‾ ± σ n z α / 2 ) (\overline{X}\pm \frac{\sigma}{\sqrt{n}}z_{\alpha/2}) (X±nσzα/2) |
μ \mu μ | σ 2 \sigma^2 σ2未知 | t = X ‾ − μ S / n ∼ t ( n − 1 ) t=\frac{\overline{X}-\mu}{S/\sqrt{n}}\sim t(n-1) t=S/nX−μ∼t(n−1) | ( X ‾ ± S n t α / 2 ( n − 1 ) ) (\overline{X}\pm \frac{S}{\sqrt{n}}t_{\alpha/2}(n-1)) (X±nStα/2(n−1)) |
若提“单侧置信限”,把 α 2 \frac \alpha{2} 2α改写成 α \alpha α即可
假设检验
在统计假设中,对假设进行检验。原问题称为原假设 H 0 H_0 H0,其否定称述为对立假设 H 1 H_1 H1。对原假设作出否定或不否定的推论,称为对 H 0 H_0 H0的显著性检验。使用的思想是小概率事件为假。
在假设检验中,由拒接原假设 H 0 H_0 H0的全体样本点所组成的集合 C C C称为否定域, C C C的补集称为 H 0 H_0 H0的接受域
假设检验要求原假设中带等号
正态总体下的六大检验及拒绝域
σ 2 \sigma^2 σ2 | u u u | H 0 H_0 H0 | 统计量 | 拒绝域 |
---|---|---|---|---|
已知 | 未知 | μ = μ 0 \mu=\mu_0 μ=μ0 | Z = X ‾ − μ σ / n Z=\frac{\overline{X}-\mu}{\sigma/\sqrt{n}} Z=σ/nX−μ | ∣ z ∣ ≥ z α / 2 \mid z\mid \geq z_{\alpha/2} ∣z∣≥zα/2 |
未知 | 未知 | μ = μ 0 \mu=\mu_0 μ=μ0 | T = X ‾ − μ S / n T=\frac{\overline{X}-\mu}{S/\sqrt{n}} T=S/nX−μ | ∣ t ∣ ≥ t α / 2 ( n − 1 ) \mid t\mid \geq t_{\alpha/2}(n-1) ∣t∣≥tα/2(n−1) |
已知 | 未知 | μ ≤ μ 0 \mu \leq \mu_0 μ≤μ0 | Z = X ‾ − μ σ / n Z=\frac{\overline{X}-\mu}{\sigma/\sqrt{n}} Z=σ/nX−μ | z ≥ z α z \geq z_\alpha z≥zα |
已知 | 未知 | μ ≥ μ 0 \mu \geq \mu_0 μ≥μ0 | Z = X ‾ − μ σ / n Z=\frac{\overline{X}-\mu}{\sigma/\sqrt{n}} Z=σ/nX−μ | z ≤ − z α z \leq -z_\alpha z≤−zα |
未知 | 未知 | μ ≤ μ 0 \mu \leq \mu_0 μ≤μ0 | T = X ‾ − μ S / n T=\frac{\overline{X}-\mu}{S/\sqrt{n}} T=S/nX−μ | t ≥ t α ( n − 1 ) t \geq t_{\alpha}(n-1) t≥tα(n−1) |
未知 | 未知 | μ ≥ μ 0 \mu \geq \mu_0 μ≥μ0 | T = X ‾ − μ S / n T=\frac{\overline{X}-\mu}{S/\sqrt{n}} T=S/nX−μ | t ≤ t α ( n − 1 ) t \leq t_{\alpha}(n-1) t≤tα(n−1) |
两类错误
两类错误 | 描述 | 发生概率 | 例子 |
---|---|---|---|
第一类错误:弃真 | 若 H 0 H_0 H0为正,按检验法则,否定 H 0 H_0 H0,此时犯了弃真错误。 | α = P { 拒 绝 H 0 ∣ H 0 为 真 } \alpha=P\{拒绝H_0\mid H_0为真\} α=P{拒绝H0∣H0为真} | 有病判无病 |
第二类错误:取伪 | 若 H 0 H_0 H0不真,按检验法则,接受 H 0 H_0 H0,此时犯了取伪错误。 | β = P { 接 受 H 0 ∣ H 0 为 假 } \beta=P\{接受H_0\mid H_0为假\} β=P{接受H0∣H0为假} | 无病判有病 |