1. 数理统计---数理统计基本概念

1. 数理统计的基本概念

基本思想: 数据 ⇒ \Rightarrow 归纳 ⇒ \Rightarrow 结果
定义: 数理统计是以概率论为基础, 关于实验数据的收集, 整理, 分析与推断的一种科学与艺术.

1.1. 数据的收集:

总体: 研究对象的全体称为总体
个体: 总体中每一个具体的对象称为个体

**例子1**: 分析某工厂灯泡的寿命 总体--该班厂所有灯泡的寿命 个体--每一个灯泡的寿命
总体: 研究对象的数量指标X $X\sim F(x)$ 个体: 总体X的可能取值
灯泡寿命的例子: **总体**--该厂所有灯泡的寿命X $$X\sim N(\mu, \sigma^2)$$ **个体**--每一个灯泡的使用寿命, 即X的一个可能取值

我知道部分个体的值, 能否预测总体?
假设灯泡服从 X ∼ N ( μ , σ 2 ) , 如 何 预 测 μ 和 σ X\sim N(\mu, \sigma^2), 如何预测\mu和\sigma XN(μ,σ2),μσ

定义1: 从总体 X X X中抽取的部分个体, 得到的数量指标 X 1 , X 2 , . . . , X n X_1, X_2, ..., X_n X1,X2,...,Xn, 若满足下条件:
(1) X 1 , X 2 , . . . , X n X_1, X_2, ..., X_n X1,X2,...,Xn X X X同分布;
(2) X 1 , X 2 , . . . , X n X_1, X_2, ..., X_n X1,X2,...,Xn相互独立.
则称 X 1 , X 2 , . . . , X n X_1, X_2, ..., X_n X1,X2,...,Xn是来自 X X X的一个简单随机样本, 简称样本

样本观测值: 对样本 X 1 , X 2 , . . . , X n X_1, X_2, ..., X_n X1,X2,...,Xn进行观测后, 得到的观测值: x 1 , x 2 , . . . , x n x_1, x_2, ..., x_n x1,x2,...,xn称为样本的观测值.(注意: 小写字母为观测值, 大写字母为样本(随机变量))

样本的联合分布: 设总体 X ∼ F ( x ) X\sim F(x) XF(x), 则样本 X 1 , X 2 , . . . , X n X_1, X_2, ..., X_n X1,X2,...,Xn的联合分布函数为:
F ( x 1 , . . . , x n ) = P { X 1 ≤ x 1 , . . . , X n ≤ x n } = ∏ i = 1 n F ( x i ) F(x_1, ..., x_n)=P\{X_1\leq x_1, ..., X_n\leq x_n\}=\prod_{i=1}^{n}F(x_i) F(x1,...,xn)=P{X1x1,...,Xnxn}=i=1nF(xi)
若总体 X X X的密度函数为 f ( x ) f(x) f(x), 则样本 X 1 , X 2 , . . . , X n X_1, X_2, ..., X_n X1,X2,...,Xn的联合密度函数为(连续性):
f ( x 1 , . . . , x n ) = ∏ i = 1 n f ( x i ) f(x_1, ..., x_n)=\prod_{i=1}^n f(x_i) f(x1,...,xn)=i=1nf(xi)
若总体 X X X的分布律为(离散型): P { X = a k } = p k , k = 1 , 2 , . . . P\{X=a_k\}=p_k, k=1,2, ... P{X=ak}=pk,k=1,2,...
则样本 X 1 , X 2 , . . . , X n X_1, X_2, ..., X_n X1,X2,...,Xn的联合分布律为:
P { X 1 = x 1 , X 2 = x 2 , . . . , X n = x n } = P { X 1 = x 1 } ∗ P { X 2 = x 2 } . . . P { X n = x n } = ∏ i = 1 n P { X = x i } P\{X_1=x_1, X_2=x_2, ..., X_n=x_n\}=P\{X_1=x_1\}*P\{X_2=x_2\}...P\{X_n=x_n\}=\prod_{i=1}^n P\{X=x_i\} P{X1=x1,X2=x2,...,Xn=xn}=P{X1=x1}P{X2=x2}...P{Xn=xn}=i=1nP{X=xi}

例子2: 设$X_1, X_2, ..., X_n$是来自总体$N(\mu, \sigma^2)$的样本, 则样本的联合密度函数为: $$f(x_1, x_2, ..., x_n)=\prod_{i=1}^n f(x_i)=\prod_{i=1}^n \frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x_i-u)^2}{2\sigma^2}}$$
例子3: 设$X_1, X_2, ..., X_n$是来自总体$B(1, p)$的样本, 则样本的联合分布函数为: $$P\{X_1=x_1, ..., X_n=x_n\}=\prod_{i=1}^n P{X=x_i}=\prod_{i=1}^{n}p^{x_1}p^{(1-x_i)}=p^{(\sum_{i=1}^n{x_i})}p^{\sum_{i=1}^n{(1-x_i)}}$$
样本与总体的关系:   总体  $\Downarrow$    $\Uparrow$ 样本 $\Rightarrow$ 样本值

1.2. 数据的整理:

统计量
定义2: 设 X 1 , X 2 , . . . , X n X_1, X_2, ..., X_n X1,X2,...,Xn是来自总体 X   F ( x ) X~F(x) X F(x)的样本, g ( x 1 , x 2 , . . . , x n ) g(x_1, x_2, ..., x_n) g(x1,x2,...,xn)是n元实值连续函数, 若 g ( x 1 , x 2 , . . . , x n ) g(x_1, x_2, ..., x_n) g(x1,x2,...,xn)不含未知参数, 则称 g ( x 1 , x 2 , . . . , x n ) g(x_1, x_2, ..., x_n) g(x1,x2,...,xn)统计量.

1.2.1 常见的统计量

X 1 , X 2 , . . . , X n X_1, X_2, ..., X_n X1,X2,...,Xn是来自样本X的样本, 则称:
( 1 ) 样 本 均 值 X ˉ = 1 n ∑ i = 1 n X i ( 2 ) 样 本 方 差 S 2 = 1 n − 1 ∑ i = 1 n ( X i − X ˉ ) 2 样 本 标 准 差 S = 1 n − 1 ∑ i = 1 n ( X i − X ˉ ) 2 ( 3 ) 样 本 K 阶 原 点 矩 A k = 1 n ∑ i = 1 n X i k ( 4 ) 样 本 K 阶 中 心 矩 B k = 1 n ∑ i = 1 n ( X i − X ˉ ) k ( 5 ) 样 本 极 大 值 , 样 本 极 小 值 , 样 本 极 差 R n = X ( n ) − X ( 1 ) \begin{aligned} (1)& 样本均值\bar X=\frac{1}{n}\sum_{i=1}^nX_i\\ (2)& 样本方差S^2=\frac{1}{n-1}\sum_{i=1}^n(X_i-\bar X)^2\\ &样本标准差S=\sqrt{\frac{1}{n-1}\sum_{i=1}^n(X_i-\bar X)^2}\\ (3)& 样本K阶原点矩 A_k=\frac{1}{n}\sum_{i=1}^nX_i^k\\ (4)& 样本K阶中心矩 B_k=\frac{1}{n}\sum_{i=1}^n(X_i-\bar X)^k\\ (5)& 样本极大值, 样本极小值, 样本极差 R_n=X_{(n)}-X_{(1)} \end{aligned} (1)(2)(3)(4)(5)Xˉ=n1i=1nXiS2=n11i=1n(XiXˉ)2S=n11i=1n(XiXˉ)2 KAk=n1i=1nXikKBk=n1i=1n(XiXˉ)k,,Rn=X(n)X(1)

1.2.2 样本均值与样本方差的数字特征

命题1: 设 X 1 , X 2 , . . . , X n X_1, X_2, ..., X_n X1,X2,...,Xn是来自总体 X   F ( x ) X~F(x) X F(x)的样本, 且总体的均值与方差存在, 记为:
E ( X ) = μ , D ( X ) = σ 2 E(X)=\mu, D(X)=\sigma^2 E(X)=μ,D(X)=σ2
则有:
( 1 ) E ( X ˉ ) = μ , D ( X ˉ ) = 1 n σ 2 ( 2 ) E ( S 2 ) = σ 2 (1)E(\bar X)=\mu, D(\bar X)=\frac{1}{n}\sigma^2\\ (2) E(S^2)=\sigma^2 (1)E(Xˉ)=μ,D(Xˉ)=n1σ2(2)E(S2)=σ2
证明:
已知 E ( X ) = μ , D ( X ) = σ 2 E(X)=\mu, D(X)=\sigma^2 E(X)=μ,D(X)=σ2
( 1 ) E ( X ˉ ) = E ( 1 n ∑ i = 1 n X i ) = 1 n ∑ i = 1 n E ( X i ) = 1 n ∗ n μ = μ D ( X ˉ ) = D ( 1 n ∑ i = 1 n X i ) = 1 n 2 ∑ i = 1 n D ( X i ) ( 此 步 用 到 独 立 同 分 布 ) = 1 n 2 ∗ σ 2 \begin{aligned} (1) E(\bar X)&=E(\frac{1}{n}\sum_{i=1}^{n}X_i)\\ &=\frac{1}{n}\sum_{i=1}^{n}E(X_i)\\ &=\frac{1}{n}*n\mu=\mu\\ D(\bar X)&=D(\frac{1}{n}\sum_{i=1}^{n}X_i)\\ &=\frac{1}{n^2}\sum_{i=1}^{n}D(X_i)(此步用到独立同分布)\\ &=\frac{1}{n^2}*\sigma^2 \end{aligned} (1)E(Xˉ)D(Xˉ)=E(n1i=1nXi)=n1i=1nE(Xi)=n1nμ=μ=D(n1i=1nXi)=n21i=1nD(Xi)()=n21σ2

(2) 先推导一个公式
∑ i = 1 n ( X i − X ˉ ) 2 = ∑ i = 1 n X i 2 − n X ˉ 2 左 边 = ∑ i = 1 n ( X i 2 − 2 X i X ˉ + X ˉ 2 ) = ∑ i = 1 n X i 2 − 2 ∑ i = 1 n X i X ˉ + ∑ i = 1 n X ˉ 2 = ∑ i = 1 n X i 2 − 2 X ˉ ∑ i = 1 n X i + n X ˉ 2 = ∑ i = 1 n X i 2 − n X ˉ 2 \begin{aligned} \sum_{i=1}^n(X_i-\bar X)^2&=\sum_{i=1}^n X_i^2-n\bar X^2\\ 左边&=\sum_{i=1}^n(X_i^2-2X_i\bar X+\bar X^2)\\ &=\sum_{i=1}^n X_i^2-2\sum_{i=1}^n X_i\bar X+\sum_{i=1}^n \bar X^2\\ &=\sum_{i=1}^n X_i^2-2\bar X\sum_{i=1}^n X_i+n\bar X^2\\ &=\sum_{i=1}^n X_i^2-n\bar X^2 \end{aligned} i=1n(XiXˉ)2=i=1nXi2nXˉ2=i=1n(Xi22XiXˉ+Xˉ2)=i=1nXi22i=1nXiXˉ+i=1nXˉ2=i=1nXi22Xˉi=1nXi+nXˉ2=i=1nXi2nXˉ2
然后证明公式:
E [ ∑ i = 1 n ( X i − X ˉ ) 2 ] = E [ ∑ i = 1 n X i 2 − n X ˉ 2 ] = ∑ i = 1 n E ( X i 2 ) − n E ( X ˉ 2 ) = ∑ i = 1 n [ D ( X i ) + E ( X i ) 2 ] − n [ D ( X ˉ ) + E ( X ˉ ) 2 ] = n σ 2 + n μ 2 − n ∗ 1 n σ 2 − n ∗ μ 2 = ( n − 1 ) σ 2 (2) \begin{aligned} E[\sum_{i=1}^n(X_i-\bar X)^2]&=E[\sum_{i=1}^n X_i^2-n\bar X^2]\\ &=\sum_{i=1}^n E(X_i^2)-nE(\bar X^2)\\ &=\sum_{i=1}^n [D(X_i)+E(X_i)^2]-n[D(\bar X)+E(\bar X)^2]\\ &=n\sigma^2+n\mu^2-n*\frac{1}{n}\sigma^2-n*\mu^2\\ &=(n-1)\sigma^2 \end{aligned}\tag{2} E[i=1n(XiXˉ)2]=E[i=1nXi2nXˉ2]=i=1nE(Xi2)nE(Xˉ2)=i=1n[D(Xi)+E(Xi)2]n[D(Xˉ)+E(Xˉ)2]=nσ2+nμ2nn1σ2nμ2=(n1)σ2(2)
最后得到:
E ( S 2 ) = E ( 1 n − 1 ∑ n − 1 1 ( X i − X ˉ ) 2 ) = 1 n − 1 E ( ∑ n − 1 1 ( X i − X ˉ ) 2 ) = 1 n − 1 ∗ ( n − 1 ) σ 2 = σ 2 \begin{aligned} E(S^2)&=E(\frac{1}{n-1}\sum_{n-1}^{1}(X_i-\bar X)^2)\\ &=\frac{1}{n-1}E(\sum_{n-1}^{1}(X_i-\bar X)^2)\\ &=\frac{1}{n-1}*(n-1)\sigma^2\\ &=\sigma^2 \end{aligned} E(S2)=E(n11n11(XiXˉ)2)=n11E(n11(XiXˉ)2)=n11(n1)σ2=σ2

上面的结果说明了什么?

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值