1. 数理统计的基本概念
基本思想: 数据
⇒
\Rightarrow
⇒归纳
⇒
\Rightarrow
⇒结果
定义: 数理统计是以概率论为基础, 关于实验数据的收集, 整理, 分析与推断的一种科学与艺术.
1.1. 数据的收集:
总体: 研究对象的全体称为总体
个体: 总体中每一个具体的对象称为个体
**例子1**: 分析某工厂灯泡的寿命 总体--该班厂所有灯泡的寿命 个体--每一个灯泡的寿命 |
灯泡寿命的例子: **总体**--该厂所有灯泡的寿命X $$X\sim N(\mu, \sigma^2)$$ **个体**--每一个灯泡的使用寿命, 即X的一个可能取值 |
我知道部分个体的值, 能否预测总体?
假设灯泡服从
X
∼
N
(
μ
,
σ
2
)
,
如
何
预
测
μ
和
σ
X\sim N(\mu, \sigma^2), 如何预测\mu和\sigma
X∼N(μ,σ2),如何预测μ和σ
定义1: 从总体
X
X
X中抽取的部分个体, 得到的数量指标
X
1
,
X
2
,
.
.
.
,
X
n
X_1, X_2, ..., X_n
X1,X2,...,Xn, 若满足下条件:
(1)
X
1
,
X
2
,
.
.
.
,
X
n
X_1, X_2, ..., X_n
X1,X2,...,Xn与
X
X
X同分布;
(2)
X
1
,
X
2
,
.
.
.
,
X
n
X_1, X_2, ..., X_n
X1,X2,...,Xn相互独立.
则称
X
1
,
X
2
,
.
.
.
,
X
n
X_1, X_2, ..., X_n
X1,X2,...,Xn是来自
X
X
X的一个简单随机样本, 简称样本
样本观测值: 对样本 X 1 , X 2 , . . . , X n X_1, X_2, ..., X_n X1,X2,...,Xn进行观测后, 得到的观测值: x 1 , x 2 , . . . , x n x_1, x_2, ..., x_n x1,x2,...,xn称为样本的观测值.(注意: 小写字母为观测值, 大写字母为样本(随机变量))
样本的联合分布: 设总体
X
∼
F
(
x
)
X\sim F(x)
X∼F(x), 则样本
X
1
,
X
2
,
.
.
.
,
X
n
X_1, X_2, ..., X_n
X1,X2,...,Xn的联合分布函数为:
F
(
x
1
,
.
.
.
,
x
n
)
=
P
{
X
1
≤
x
1
,
.
.
.
,
X
n
≤
x
n
}
=
∏
i
=
1
n
F
(
x
i
)
F(x_1, ..., x_n)=P\{X_1\leq x_1, ..., X_n\leq x_n\}=\prod_{i=1}^{n}F(x_i)
F(x1,...,xn)=P{X1≤x1,...,Xn≤xn}=i=1∏nF(xi)
若总体
X
X
X的密度函数为
f
(
x
)
f(x)
f(x), 则样本
X
1
,
X
2
,
.
.
.
,
X
n
X_1, X_2, ..., X_n
X1,X2,...,Xn的联合密度函数为(连续性):
f
(
x
1
,
.
.
.
,
x
n
)
=
∏
i
=
1
n
f
(
x
i
)
f(x_1, ..., x_n)=\prod_{i=1}^n f(x_i)
f(x1,...,xn)=i=1∏nf(xi)
若总体
X
X
X的分布律为(离散型):
P
{
X
=
a
k
}
=
p
k
,
k
=
1
,
2
,
.
.
.
P\{X=a_k\}=p_k, k=1,2, ...
P{X=ak}=pk,k=1,2,...
则样本
X
1
,
X
2
,
.
.
.
,
X
n
X_1, X_2, ..., X_n
X1,X2,...,Xn的联合分布律为:
P
{
X
1
=
x
1
,
X
2
=
x
2
,
.
.
.
,
X
n
=
x
n
}
=
P
{
X
1
=
x
1
}
∗
P
{
X
2
=
x
2
}
.
.
.
P
{
X
n
=
x
n
}
=
∏
i
=
1
n
P
{
X
=
x
i
}
P\{X_1=x_1, X_2=x_2, ..., X_n=x_n\}=P\{X_1=x_1\}*P\{X_2=x_2\}...P\{X_n=x_n\}=\prod_{i=1}^n P\{X=x_i\}
P{X1=x1,X2=x2,...,Xn=xn}=P{X1=x1}∗P{X2=x2}...P{Xn=xn}=i=1∏nP{X=xi}
例子2: 设$X_1, X_2, ..., X_n$是来自总体$N(\mu, \sigma^2)$的样本, 则样本的联合密度函数为: $$f(x_1, x_2, ..., x_n)=\prod_{i=1}^n f(x_i)=\prod_{i=1}^n \frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x_i-u)^2}{2\sigma^2}}$$ |
例子3: 设$X_1, X_2, ..., X_n$是来自总体$B(1, p)$的样本, 则样本的联合分布函数为: $$P\{X_1=x_1, ..., X_n=x_n\}=\prod_{i=1}^n P{X=x_i}=\prod_{i=1}^{n}p^{x_1}p^{(1-x_i)}=p^{(\sum_{i=1}^n{x_i})}p^{\sum_{i=1}^n{(1-x_i)}}$$ |
样本与总体的关系: 总体 $\Downarrow$ $\Uparrow$ 样本 $\Rightarrow$ 样本值 |
1.2. 数据的整理:
统计量
定义2: 设
X
1
,
X
2
,
.
.
.
,
X
n
X_1, X_2, ..., X_n
X1,X2,...,Xn是来自总体
X
F
(
x
)
X~F(x)
X F(x)的样本,
g
(
x
1
,
x
2
,
.
.
.
,
x
n
)
g(x_1, x_2, ..., x_n)
g(x1,x2,...,xn)是n元实值连续函数, 若
g
(
x
1
,
x
2
,
.
.
.
,
x
n
)
g(x_1, x_2, ..., x_n)
g(x1,x2,...,xn)不含未知参数, 则称
g
(
x
1
,
x
2
,
.
.
.
,
x
n
)
g(x_1, x_2, ..., x_n)
g(x1,x2,...,xn)为统计量.
1.2.1 常见的统计量
设
X
1
,
X
2
,
.
.
.
,
X
n
X_1, X_2, ..., X_n
X1,X2,...,Xn是来自样本X的样本, 则称:
(
1
)
样
本
均
值
X
ˉ
=
1
n
∑
i
=
1
n
X
i
(
2
)
样
本
方
差
S
2
=
1
n
−
1
∑
i
=
1
n
(
X
i
−
X
ˉ
)
2
样
本
标
准
差
S
=
1
n
−
1
∑
i
=
1
n
(
X
i
−
X
ˉ
)
2
(
3
)
样
本
K
阶
原
点
矩
A
k
=
1
n
∑
i
=
1
n
X
i
k
(
4
)
样
本
K
阶
中
心
矩
B
k
=
1
n
∑
i
=
1
n
(
X
i
−
X
ˉ
)
k
(
5
)
样
本
极
大
值
,
样
本
极
小
值
,
样
本
极
差
R
n
=
X
(
n
)
−
X
(
1
)
\begin{aligned} (1)& 样本均值\bar X=\frac{1}{n}\sum_{i=1}^nX_i\\ (2)& 样本方差S^2=\frac{1}{n-1}\sum_{i=1}^n(X_i-\bar X)^2\\ &样本标准差S=\sqrt{\frac{1}{n-1}\sum_{i=1}^n(X_i-\bar X)^2}\\ (3)& 样本K阶原点矩 A_k=\frac{1}{n}\sum_{i=1}^nX_i^k\\ (4)& 样本K阶中心矩 B_k=\frac{1}{n}\sum_{i=1}^n(X_i-\bar X)^k\\ (5)& 样本极大值, 样本极小值, 样本极差 R_n=X_{(n)}-X_{(1)} \end{aligned}
(1)(2)(3)(4)(5)样本均值Xˉ=n1i=1∑nXi样本方差S2=n−11i=1∑n(Xi−Xˉ)2样本标准差S=n−11i=1∑n(Xi−Xˉ)2样本K阶原点矩Ak=n1i=1∑nXik样本K阶中心矩Bk=n1i=1∑n(Xi−Xˉ)k样本极大值,样本极小值,样本极差Rn=X(n)−X(1)
1.2.2 样本均值与样本方差的数字特征
命题1: 设
X
1
,
X
2
,
.
.
.
,
X
n
X_1, X_2, ..., X_n
X1,X2,...,Xn是来自总体
X
F
(
x
)
X~F(x)
X F(x)的样本, 且总体的均值与方差存在, 记为:
E
(
X
)
=
μ
,
D
(
X
)
=
σ
2
E(X)=\mu, D(X)=\sigma^2
E(X)=μ,D(X)=σ2
则有:
(
1
)
E
(
X
ˉ
)
=
μ
,
D
(
X
ˉ
)
=
1
n
σ
2
(
2
)
E
(
S
2
)
=
σ
2
(1)E(\bar X)=\mu, D(\bar X)=\frac{1}{n}\sigma^2\\ (2) E(S^2)=\sigma^2
(1)E(Xˉ)=μ,D(Xˉ)=n1σ2(2)E(S2)=σ2
证明:
已知
E
(
X
)
=
μ
,
D
(
X
)
=
σ
2
E(X)=\mu, D(X)=\sigma^2
E(X)=μ,D(X)=σ2
(
1
)
E
(
X
ˉ
)
=
E
(
1
n
∑
i
=
1
n
X
i
)
=
1
n
∑
i
=
1
n
E
(
X
i
)
=
1
n
∗
n
μ
=
μ
D
(
X
ˉ
)
=
D
(
1
n
∑
i
=
1
n
X
i
)
=
1
n
2
∑
i
=
1
n
D
(
X
i
)
(
此
步
用
到
独
立
同
分
布
)
=
1
n
2
∗
σ
2
\begin{aligned} (1) E(\bar X)&=E(\frac{1}{n}\sum_{i=1}^{n}X_i)\\ &=\frac{1}{n}\sum_{i=1}^{n}E(X_i)\\ &=\frac{1}{n}*n\mu=\mu\\ D(\bar X)&=D(\frac{1}{n}\sum_{i=1}^{n}X_i)\\ &=\frac{1}{n^2}\sum_{i=1}^{n}D(X_i)(此步用到独立同分布)\\ &=\frac{1}{n^2}*\sigma^2 \end{aligned}
(1)E(Xˉ)D(Xˉ)=E(n1i=1∑nXi)=n1i=1∑nE(Xi)=n1∗nμ=μ=D(n1i=1∑nXi)=n21i=1∑nD(Xi)(此步用到独立同分布)=n21∗σ2
(2) 先推导一个公式
∑
i
=
1
n
(
X
i
−
X
ˉ
)
2
=
∑
i
=
1
n
X
i
2
−
n
X
ˉ
2
左
边
=
∑
i
=
1
n
(
X
i
2
−
2
X
i
X
ˉ
+
X
ˉ
2
)
=
∑
i
=
1
n
X
i
2
−
2
∑
i
=
1
n
X
i
X
ˉ
+
∑
i
=
1
n
X
ˉ
2
=
∑
i
=
1
n
X
i
2
−
2
X
ˉ
∑
i
=
1
n
X
i
+
n
X
ˉ
2
=
∑
i
=
1
n
X
i
2
−
n
X
ˉ
2
\begin{aligned} \sum_{i=1}^n(X_i-\bar X)^2&=\sum_{i=1}^n X_i^2-n\bar X^2\\ 左边&=\sum_{i=1}^n(X_i^2-2X_i\bar X+\bar X^2)\\ &=\sum_{i=1}^n X_i^2-2\sum_{i=1}^n X_i\bar X+\sum_{i=1}^n \bar X^2\\ &=\sum_{i=1}^n X_i^2-2\bar X\sum_{i=1}^n X_i+n\bar X^2\\ &=\sum_{i=1}^n X_i^2-n\bar X^2 \end{aligned}
i=1∑n(Xi−Xˉ)2左边=i=1∑nXi2−nXˉ2=i=1∑n(Xi2−2XiXˉ+Xˉ2)=i=1∑nXi2−2i=1∑nXiXˉ+i=1∑nXˉ2=i=1∑nXi2−2Xˉi=1∑nXi+nXˉ2=i=1∑nXi2−nXˉ2
然后证明公式:
E
[
∑
i
=
1
n
(
X
i
−
X
ˉ
)
2
]
=
E
[
∑
i
=
1
n
X
i
2
−
n
X
ˉ
2
]
=
∑
i
=
1
n
E
(
X
i
2
)
−
n
E
(
X
ˉ
2
)
=
∑
i
=
1
n
[
D
(
X
i
)
+
E
(
X
i
)
2
]
−
n
[
D
(
X
ˉ
)
+
E
(
X
ˉ
)
2
]
=
n
σ
2
+
n
μ
2
−
n
∗
1
n
σ
2
−
n
∗
μ
2
=
(
n
−
1
)
σ
2
(2)
\begin{aligned} E[\sum_{i=1}^n(X_i-\bar X)^2]&=E[\sum_{i=1}^n X_i^2-n\bar X^2]\\ &=\sum_{i=1}^n E(X_i^2)-nE(\bar X^2)\\ &=\sum_{i=1}^n [D(X_i)+E(X_i)^2]-n[D(\bar X)+E(\bar X)^2]\\ &=n\sigma^2+n\mu^2-n*\frac{1}{n}\sigma^2-n*\mu^2\\ &=(n-1)\sigma^2 \end{aligned}\tag{2}
E[i=1∑n(Xi−Xˉ)2]=E[i=1∑nXi2−nXˉ2]=i=1∑nE(Xi2)−nE(Xˉ2)=i=1∑n[D(Xi)+E(Xi)2]−n[D(Xˉ)+E(Xˉ)2]=nσ2+nμ2−n∗n1σ2−n∗μ2=(n−1)σ2(2)
最后得到:
E
(
S
2
)
=
E
(
1
n
−
1
∑
n
−
1
1
(
X
i
−
X
ˉ
)
2
)
=
1
n
−
1
E
(
∑
n
−
1
1
(
X
i
−
X
ˉ
)
2
)
=
1
n
−
1
∗
(
n
−
1
)
σ
2
=
σ
2
\begin{aligned} E(S^2)&=E(\frac{1}{n-1}\sum_{n-1}^{1}(X_i-\bar X)^2)\\ &=\frac{1}{n-1}E(\sum_{n-1}^{1}(X_i-\bar X)^2)\\ &=\frac{1}{n-1}*(n-1)\sigma^2\\ &=\sigma^2 \end{aligned}
E(S2)=E(n−11n−1∑1(Xi−Xˉ)2)=n−11E(n−1∑1(Xi−Xˉ)2)=n−11∗(n−1)σ2=σ2
上面的结果说明了什么?