统计框架:从置信区间到学习理论
1. 置信区间与假设检验
1.1 置信区间
置信区间是统计学中一个重要的概念,用于估计总体参数的可能范围。设 $X = {x_1, x_2, \cdots, x_n}$ 是来自具有统计参数 $\theta$ 的概率分布的随机样本。参数 $\theta$ 的置信区间由一对随机变量 $u(X)$ 和 $v(X)$ 确定,对于所有的 $\theta$,置信区间可表示为:
[P_{\theta}(u(X) < \theta < v(X)) = \gamma]
其中,$\gamma$ 表示置信水平,$u(X)$ 和 $v(X)$ 是该区间的随机端点。置信水平 $\gamma$ 接近但不大于 1,可表示为 $\gamma = 1 - \alpha$,其中 $\alpha$ 是一个接近 0 的非负小数。$P_{\theta}(\cdot)$ 表示依赖于统计参数 $\theta$ 的概率分布。
1.2 假设检验
假设检验是对总体参数进行统计假设,并根据样本数据检验该假设是否成立的过程。在统计学中,关于参数的假设分为原假设($H_0$)和备择假设($H_1$)。原假设通常由分析人员确定,反映了分析人员对未知参数的看法;备择假设则反映了关于参数可能取值的另一种假设。
为了检验原假设和备择假设,需要引入两个重要概念:显著性水平 $\alpha$ 和 p 值。显著性水平 $\alpha$ 表示拒绝原假设的概率,p 值表示原假设为真的概率。
下面通过一个例子来说明假设检验的过程:
- 原假设($H_0$) :服用维生素 C 不能
超级会员免费看
订阅专栏 解锁全文
2万+

被折叠的 条评论
为什么被折叠?



