t检验

本文介绍了t检验,其目的是判断两个样本集某个属性的均值是否有显著差异,属于推论统计学。文中阐述了t检验的分类,包括单样本、两独立样本和成对样本t检验,还讲解了t值与p值的含义,同时指出应用t检验的限制,并给出结果书写示例。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

参考视频: StatsCast: What is a t-test?(需要梯子)

t检验的目的

t检验的目的是判断两个样本集某个属性的均值是否有显著差异

为什么需要t检验

直接比较两个样本集的均值只能给出已知差异(描述统计学), 但是无法保证两个样本集所各自代表的整体也具有同样的差异, 因为结果可能是偶然性造成的(无法用局部代表整体).
要通过已知样本来理解整体, 需要用到推论统计学, t检验就是属于推论统计学的内容. t检验要通过样本数据, 得到样本所代表的整体之间的差异.

t检验的分类

单样本t检验

适用于一个样本群体某种属性的均值与某个特定值的比较;例如实验中,对做某种处理的一组小白鼠的体重与正常小白鼠体重(已知值)比较

两独立样本 T 检验

前提:先进行方差的齐性检验
若方差相同,则使用同方差检验
若方差不同,则使用异方差检验

适用于两个相对独立的群体某个相同属性均值的比较,比如男性、女性群体的身高比较。

成对样本 T 检验

适用于对同一组样本两次测量的均值比较,例如同一年级学生的两次考试.

t检验的两个指标: t值与p值的理解

t = 样 本 之 间 的 方 差 样 本 内 部 的 方 差 t = \frac{样本之间的方差}{样本内部的方差} t=t越大, 说明两个样本集之间差异就越大, 反之差异越小. 如果样本集的数据点越分散(样本内部方差大), 越难判断样本集间的差异大小.

但得到的t值只是已知样本集之间的差异大小, 这个t值能有多大的置信度代表整体之间的差异? 这由p值来表示.

p值: p值是指 (t所代表的样本集之间的差异可能是由随机数据导致的) 的概率大小. 换言之, p值是量化表示 样本集之间的差异是真实差异 还是 偶然因素造成的.

例如, p=0.05, 表示有5%的可能性t所代表的这种差异是随机因素造成的. 换言之, 就是有5%的可能性两个样本集所代表的整体之间是完全一样的.

一般设置p=0.05为阈值, 当p小于0.05时, 认为两个样本集所表示的整体之间有显著差异. 就是说, 如果p=0.01, 这种差异是随机因素造成的的概率只有1%, 99%的概率可能是真实差异, 概率足够大, 我们就认为是有显著差异的.

注意: p值的计算公式里是除以了t值的, 表示是在同样的t值差异下来量化p所代表的概率.

应用t检验的一些限制

  1. 样本和整体应该是正态分布的, 离均值越远的比例越低, 否则p值可能不准确.
  2. 两个样本集的数量应该是相等的. 不相等的样本集可能导致结果不准确.
  3. 样本集内部每个样本之间应该是相互独立的, 不会相互影响.

如何写t检验的结果

两独立样本t检验被应用于确定xx减肥药的效果, t(99) = 0.33, p = 0.37, 发现两组人群体重没有显著差别(实验组M=60, 对照组M=62).
注: 99表示自由度, 为样本数量-1, 所以可知样本数量为100人; M表示实验组和对照组的体重均值.

### T检验的定义及其分类 T检验是一种用于比较两组数据均值是否存在显著差异的统计分析方法。它主要用于小样本数据分析,当样本数量较小时,正态分布可能不适用,而T检验则通过计算t统计量并评估其对应的p值来判断两个群体之间的差异是否有统计学意义。 #### 独立样本T检验 独立样本T检验适用于比较来自不同群体的数据集。例如,在研究两种治疗方法的效果时,可以通过该测试验证治疗前后的效果是否一致[^1]。以下是使用Python实现的一个例子: ```python import numpy as np from scipy import stats group1 = np.array([23, 21, 19, 25, 27]) group2 = np.array([17, 19, 21, 15, 13]) t_stat_ind, p_val_ind = stats.ttest_ind(group1, group2) print(f'Independent t-test: t-statistic = {t_stat_ind}, p-value = {p_val_ind}') ``` 此代码片段展示了如何利用`stats.ttest_ind()`函数完成独立样本T检验,并返回相应的t统计量和p值[^1]。 #### 配对样本T检验 配对样本T检验适合用来检测同一对象在某种干预措施前后变化的情况下的均值差别的显著性。比如测量患者接受特定药物治疗之前与之后的症状评分的变化程度[^1]。下面是另一个基于Python的例子: ```python before_treatment = np.array([23, 21, 19, 25, 27]) after_treatment = np.array([21, 19, 20, 23, 24]) t_stat_paired, p_val_paired = stats.ttest_rel(before_treatment, after_treatment) print(f'Paired t-test: t-statistic = {t_stat_paired}, p-value = {p_val_paired}') ``` 这里运用了`stats.ttest_rel()`来进行成对观测值间的对比操作。 #### 单样本T检验 单样本T检验旨在确定单一数据集合体平均数偏离指定理论数值的程度是否达到显著水准。这有助于了解实际收集到的一系列读数是否接近预期目标值或者标准参考线[^2]。下面给出一段示范程序: ```python from scipy import stats population_mean = 100 data = pd.Series([...]) # 插入具体实验所得资料序列 t_stat, p_value = stats.ttest_1samp(data, population_mean) print(f"t统计量: {t_stat}, p值: {p_value}") ``` 上述脚本说明了怎样借助`stats.ttest_1samp()`达成针对单独一组实测成果开展假设检定的目的[^2]。 无论采用哪种形式的T检验,最终都需要依据得到的p值去判定原命题(null hypothesis)能否被否定。一般而言,若p值低于预设阈限(如α=0.05),就可认定存在明显区别;反之,则缺乏足够证据支持这一结论[^3]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值