12 均值的假设检验
标签: 机器学习与数据挖掘
(此篇的R代码对应本系列的《12 R语言手册(第五站 单变量分析)》)
1.假设检验基本概念
假设检验是指使用样本中的证据来断言总体参数值的过程。针对参数值,精心设计了两种矛盾的声明或假设。具体如下:
- 零假设 H 0 H_0 H0是原假设,表示参数值已经假定的内容。
- 另一种假设或研究假设
H
a
H_a
Ha表示参数值的另一个断言。
两种可能的结论是 ( a ) (a) (a) 拒绝 H 0 H_0 H0 和 ( b ) (b) (b) 不拒绝 H 0 H_0 H0 。刑事审判是一种假设检验形式,具有如下的假设:
H 0 H_0 H0:被告是无辜的
H a H_a Ha:被告是有罪的
在这两个假设之下,又有四种情况:
- 类型I错误:当 H 0 H_0 H0是真时,拒绝 H 0 H_0 H0。陪审团宣判一个无辜的人有罪。
- 类型IⅡ错误:当 H 0 H_0 H0假时,没有拒绝 H 0 H_0 H0。陪审团无罪释放一个有罪的人。
- 正确的裁决:当 H 0 H_0 H0是假时,拒绝 H 0 H_0 H0。陪审团宣判一个有罪的人有罪。
- 正确的裁决:当 H 0 H_0 H0是真时,没有拒绝 H 0 H_0 H0。陪审团无罪释放一个无辜的人。
类型I错误的概率记为
α
\alpha
α,而类型IⅡ错误的概率记为
β
\beta
β。对于一个固定样本容量,
α
\alpha
α 减小与
β
\beta
β增大相关,反之亦然。在统计分析中,
α
\alpha
α 通常固定在某个较小值,例如0.05,称之为显著性水平。
均值假设检验的一般处理是将假设限定为以下3种形式:
(其中
μ
0
\mu_0
μ0表示
μ
\mu
μ的一个假设值。)
- 左尾检验。 H 0 : μ ⩾ μ 0 H_0:\mu \geqslant \mu _0 H0:μ⩾μ0与 H 0 : μ < μ 0 H_0:\mu <\mu _0 H0:μ<μ0
- 右尾检验。 H 0 : μ ⩽ μ 0 H_0:\mu \leqslant \mu _0 H0:μ⩽μ0与 H 0 : μ > μ 0 H_0:\mu >\mu _0 H0:μ>μ0
- 双尾检验。 H 0 : μ = μ 0 H_0:\mu = \mu _0 H0:μ=μ0与 H 0 : μ ≠ μ 0 H_0:\mu \ne \mu _0 H0:μ̸=μ0
当样本容量很大或者总体为正态分布时,检验统计量 t d a t a = x ˉ − μ 0 s n t{data}=\frac{\bar{x}-\mu 0}{\frac{s}{\sqrt{n}}} tdata=nsxˉ−μ0遵循自由度为 n − 1 n-1 n−1的t分布。 t d a t a t_{data} tdata的值可理解为在假设的均值 \mu 之上或之下的标准误差数目,样本均值 x ˉ \bar{x} xˉ,其中标准误差等于 s n \frac{s}{\sqrt{n}} ns(粗略地讲,标准误差表示统计量分布的分散程度度量)。当 t d a t a t_{data} tdata值为极值时,这表明一种零假设(伴随假设值$ \mu_0 ) 和 观 测 数 据 之 间 的 冲 突 。 由 于 数 据 表 示 经 验 证 据 零 假 设 仅 仅 表 示 一 种 断 言 , 因 此 解 决 这 样 的 冲 突 有 利 于 数 据 , 因 此 , 当 )和观测数据之间的冲突。由于数据表示经验证据零假设仅仅表示一种断言,因此解决这样的冲突有利于数据,因此,当 )和观测数据之间的冲突。由于数据表示经验证据零假设仅仅表示一种断言,因此解决这样的冲突有利于数据,因此,当t_{data} 为 极 值 时 , 假 设 为极值时,假设 为极值时,假设H_0 是 拒 绝 的 。 什 么 样 的 极 值 才 算 是 极 值 ? 需 要 使 用 p − 值 进 行 度 量 。 p − 值 是 指 : 如 果 我 们 假 定 零 假 设 为 真 时 , 观 测 样 本 统 计 量 ( 比 如 是拒绝的。什么样的极值才算是极值?需要使用 p-值 进行度量。 p-值 是指:如果我们假定零假设为真时,观测样本统计量(比如 是拒绝的。什么样的极值才算是极值?需要使用p−值进行度量。p−值是指:如果我们假定零假设为真时,观测样本统计量(比如\bar{x} 和 和 和t_{data}$。)至少与真实测的统计量一样极端的概率。由于 p-值(“概率值”)表示一个概率,因此其值必须总是于 0 和 1 区间。下表说明了针对假设检验形式如何计算p-值。

假设检验形式的名称表明p-值将会在t分布的哪尾或双尾中发现。
一个较小p-值将表明数据与零假设之间的冲突。因此,如果p-值较小,我们将拒绝H_0。
多小才为较小?因为研究者设置显著性水平
α
\alpha
α为某个较小值(比如0.05),因此,如果 p-值 小于
α
\alpha
α,我们则认为p-值较小。这引导我们得出拒绝规则:
“如果p-值小于
α
\alpha
α,拒绝
H
0
H_0
H0。”
2.比例的假设检验
关于总体比例\pi的假设检验也可以被执行。检验统计量为:
Z
d
a
t
a
=
p
−
π
0
(
π
0
(
1
−
π
0
)
/
n
)
Z_{data}=\frac{p-\pi _0}{\sqrt{\left( \pi _0\left( 1-\pi _0 \right) /n \right)}}
Zdata=(π0(1−π0)/n)p−π0
(其中,
π
0
\pi_0%为%\pi
π0的假设值,
p
p
p为样本比例。)

3.拓展
关于检验假设的历史,知乎上有个特别好的答案:https://www.zhihu.com/question/317252051/answer/633033538?utm_oi=50144498155520
博客围绕均值和比例的假设检验展开。介绍了假设检验基本概念,包括零假设、研究假设,以及类型I和类型II错误等,还说明了均值假设检验的三种形式、检验统计量和p - 值的应用。此外,提及了总体比例的假设检验统计量,最后给出检验假设历史的相关知乎答案链接。
6983

被折叠的 条评论
为什么被折叠?



