假设检验也叫显著性检验,是以小概率反证法的逻辑进行推理,是判断假设是否成立的统计方法。
一般,首先假设样本对应的总体参数或分布是与已知的总体参数或分布相同的,然后根据统计量的分布规律来分析样本数据,利用样本信息判断是否支持当前假设,并对检验假设作出取舍抉择。该方法作出的结论是概率性的,不是绝对的肯定或否定。
#T检验的概念:
T检验是用于两个样本(或样本与总体)平均值差异程度的检验方法。利用T分布理论来推断差异发生的概率,从而判断两个平均数的差异是否显著。
#适用条件:
-
样本分布符合正态分布。
-
当样本数较小时,要求样本随机取自正态总体。
-
当两个样本均数比较是,要求两个样本的总体方差相等。(齐差性)
#T检验的用途:
-
样本均数与总体均数的比较
-
两样本均数的比较
#假设检验的步骤:
1、建立检验假设和确定检验水准
检验假设是针对总体特征而言,包括相互对立的两个方面,即两种假设:一种是无效假设或称原假设、零假设,符号为H0,它是要否定的假设;另一种是备择假设,记为H1,它是H0的对立面。二者是从反证法的思想提出的, H1和H0是相互联系、又相互对立的假设。
假设检验还需根据不同研究目的事先设置是否拒绝原假设的判断标准,即检验水准。检验水准也称显著性水准,它指无效假设H0为真,但被错误地拒绝的一个小概率值,一般取检验水准α =0.05。
单侧检验和双侧检验:
• 在进行T检验时,如果其目的在于检验两个总体均数是否相等,即为双侧检验。 例如检验某种新减肥药物与常用减肥药的效果是否相同?就是说,新药效力可能比旧药好,也可能比旧药差,或者力相同,都有可能。
• 如果我们已知新药效力不可能低于旧药效力,例如新药剂从理论上推知其效果不可能低于旧药剂,这时,无效假设为H0:μ1=μ2, 备择假设为H1: μ1>μ2 , 统计上称为单侧检验。
2、选定检验方法和计算检验统计量
要根据研究设计的类型和统计推断的目的选用不同的检验方法。如成组设计的两样本均数的比较用T检验,多个样本均数的比较用F检验。
检验统计量是用于抉择是否拒绝H0的统计量(因此在我们确定检验假设H0,H1时,检验方法和检验统计量就已经确定了),其统计分布在统计推断中是至关重要的,不同的检验方法要用不同的方式计算现有样本的检验统计量值。
3、确定p值和作出推断结论。
这里的P值是指由H0成立时的检验统计量出现在由样本计算出来的检验统计量的末端或更末端处的概率值。
当P≤ α时,结论为按所取检验水准拒绝H0,接受H1,这样做出结论的理由是:在H0成立的条件下,出现等于及大于现有检验统计量值的概率P≤ α ,是小概率事件,这在一次抽样中是不大可能发生的,即现有样本信息不支持H0因而拒绝它;若P>α,即样本信息支持H0,就没有理由拒绝它,此时接受它。
#T检验类型:
1、单体检验
用于检验样本的分布期望是否等于某个值,其统计量服从自由度为n-1的T分布:
2、双体检验
用于检验两组样本的分布期望是否相等,又分为配对双体检验和非配对双体检验。
配对双体检验的两组样本数据是一一对应的,而非配对双体检验的两组数据则是独立的。 例如药物实验中,配对双体检验适用于观察同一组人服用药物之前和之后,非配对双体检验适用于一组服用药物而一组不服用药物。
2.1 配对双体检验
配对双体检验针对配对的两组样本。配对双体检验假设两组样本之间的差值服从正态分布。如果该正态分布的期望为零,则说明这两组样本不存在显著差异。零假设为 H0:μ=μ0,统计量服从n-1的T分布,其中d是差值的平均值,s是差值的样本标准差。
2.2 非配对双体检验
非配对双体检验针对独立的两组样本。非配对双体检验假设两组样本是从不同的正态分布采样出来的。根据两个正态分布的标准差是否相等,非配对双体检验又可以分两类。
一种是分布标准差相等的情况。零假设是两组样本的分布期望相等,统计量 T 服从自由度为 n1+n2-2的T分布:
其中x1和x2分别是两组样本的平均值,n1和n2分别是两组样本的大小,s1和s2分别是两组样本的样本标准差。
另一种是分布标准差不相等的情况。零假设也是两组样本的分布期望相等,统计量 T 服从 T 分布:
d.f. 为T分布的自由度。