12 均值的假设检验

博客围绕均值和比例的假设检验展开。介绍了假设检验基本概念,包括零假设、研究假设,以及类型I和类型II错误等,还说明了均值假设检验的三种形式、检验统计量和p - 值的应用。此外,提及了总体比例的假设检验统计量,最后给出检验假设历史的相关知乎答案链接。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

12 均值的假设检验

标签: 机器学习与数据挖掘
(此篇的R代码对应本系列的《12 R语言手册(第五站 单变量分析)》)

1.假设检验基本概念

  假设检验是指使用样本中的证据来断言总体参数值的过程。针对参数值,精心设计了两种矛盾的声明或假设。具体如下:

  • 零假设 H 0 H_0 H0是原假设,表示参数值已经假定的内容。
  • 另一种假设或研究假设 H a H_a Ha表示参数值的另一个断言。
    两种可能的结论是 ( a ) (a) (a) 拒绝 H 0 H_0 H0 ( b ) (b) (b) 不拒绝 H 0 H_0 H0 。刑事审判是一种假设检验形式,具有如下的假设:
         H 0 H_0 H0:被告是无辜的
         H a H_a Ha:被告是有罪的

在这两个假设之下,又有四种情况:

  • 类型I错误:当 H 0 H_0 H0是真时,拒绝 H 0 H_0 H0。陪审团宣判一个无辜的人有罪。
  • 类型IⅡ错误:当 H 0 H_0 H0假时,没有拒绝 H 0 H_0 H0。陪审团无罪释放一个有罪的人。
  • 正确的裁决:当 H 0 H_0 H0是假时,拒绝 H 0 H_0 H0。陪审团宣判一个有罪的人有罪。
  • 正确的裁决:当 H 0 H_0 H0是真时,没有拒绝 H 0 H_0 H0。陪审团无罪释放一个无辜的人。

  类型I错误的概率记为 α \alpha α,而类型IⅡ错误的概率记为 β \beta β。对于一个固定样本容量, α \alpha α 减小与 β \beta β增大相关,反之亦然。在统计分析中, α \alpha α 通常固定在某个较小值,例如0.05,称之为显著性水平。
均值假设检验的一般处理是将假设限定为以下3种形式:
(其中 μ 0 \mu_0 μ0表示 μ \mu μ的一个假设值。)

  • 左尾检验。 H 0 : μ ⩾ μ 0 H_0:\mu \geqslant \mu _0 H0:μμ0 H 0 : μ &lt; μ 0 H_0:\mu &lt;\mu _0 H0:μ<μ0
  • 右尾检验。 H 0 : μ ⩽ μ 0 H_0:\mu \leqslant \mu _0 H0:μμ0 H 0 : μ &gt; μ 0 H_0:\mu &gt;\mu _0 H0:μ>μ0
  • 双尾检验。 H 0 : μ = μ 0 H_0:\mu = \mu _0 H0:μ=μ0 H 0 : μ ≠ μ 0 H_0:\mu \ne \mu _0 H0:μ̸=μ0

当样本容量很大或者总体为正态分布时,检验统计量 t d a t a = x ˉ − μ 0 s n t{data}=\frac{\bar{x}-\mu 0}{\frac{s}{\sqrt{n}}} tdata=n sxˉμ0遵循自由度为 n − 1 n-1 n1的t分布。 t d a t a t_{data} tdata的值可理解为在假设的均值 \mu 之上或之下的标准误差数目,样本均值 x ˉ \bar{x} xˉ,其中标准误差等于 s n \frac{s}{\sqrt{n}} n s(粗略地讲,标准误差表示统计量分布的分散程度度量)。当 t d a t a t_{data} tdata值为极值时,这表明一种零假设(伴随假设值$ \mu_0 ) 和 观 测 数 据 之 间 的 冲 突 。 由 于 数 据 表 示 经 验 证 据 零 假 设 仅 仅 表 示 一 种 断 言 , 因 此 解 决 这 样 的 冲 突 有 利 于 数 据 , 因 此 , 当 )和观测数据之间的冲突。由于数据表示经验证据零假设仅仅表示一种断言,因此解决这样的冲突有利于数据,因此,当 t_{data} 为 极 值 时 , 假 设 为极值时,假设 H_0 是 拒 绝 的 。 什 么 样 的 极 值 才 算 是 极 值 ? 需 要 使 用 p − 值 进 行 度 量 。 p − 值 是 指 : 如 果 我 们 假 定 零 假 设 为 真 时 , 观 测 样 本 统 计 量 ( 比 如 是拒绝的。什么样的极值才算是极值?需要使用 p-值 进行度量。 p-值 是指:如果我们假定零假设为真时,观测样本统计量(比如 使pp\bar{x} 和 和 t_{data}$。)至少与真实测的统计量一样极端的概率。由于 p-值(“概率值”)表示一个概率,因此其值必须总是于 0 和 1 区间。下表说明了针对假设检验形式如何计算p-值。

在这里插入图片描述

假设检验形式的名称表明p-值将会在t分布的哪尾或双尾中发现。
一个较小p-值将表明数据与零假设之间的冲突。因此,如果p-值较小,我们将拒绝H_0。
多小才为较小?因为研究者设置显著性水平 α \alpha α为某个较小值(比如0.05),因此,如果 p-值 小于 α \alpha α,我们则认为p-值较小。这引导我们得出拒绝规则:
“如果p-值小于 α \alpha α,拒绝 H 0 H_0 H0。”

2.比例的假设检验

关于总体比例\pi的假设检验也可以被执行。检验统计量为:
Z d a t a = p − π 0 ( π 0 ( 1 − π 0 ) / n ) Z_{data}=\frac{p-\pi _0}{\sqrt{\left( \pi _0\left( 1-\pi _0 \right) /n \right)}} Zdata=(π0(1π0)/n) pπ0
(其中, π 0 \pi_0%为%\pi π0的假设值, p p p为样本比例。)

在这里插入图片描述

3.拓展

关于检验假设的历史,知乎上有个特别好的答案:https://www.zhihu.com/question/317252051/answer/633033538?utm_oi=50144498155520

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值