非参数检验
1. 秩和检验
目的:检验两组或多组数据均值是否相等,与t检验不同的是不要求正态分布,只要求样本独立。
方法:把所有数据放到一起,从小到大排列,每个数据的位置标号就是秩。
两总体秩和检验;多总体秩和检验(要求,每个总体的样本含量大于5,总样本含量大于15);
H0:各总体均值无明显差异;
注意事项:一般来说,成组数据的t检验和方差分析比秩和检验更准确,这是由于秩和检验只利用了排序的位置信息,没有利用差值的大小,但是秩和检验可以用于更广泛,比如总体非正态、定性数据等。
2. 符号检验
方法:相当于对配对数据的检验,只考虑没对数据差值的符号,而不管其绝对值大小
H0:两处理无差异。若H0成立,则’+’’-’出现的概率都是1/2
优缺点:不要求总体服从正态分布,可用定性资料,计算简单。缺点是利用信息较少,不够准确。
注意事项:若有差值为0的舍弃,总样本含量减去1;样品数要大于等于5.
3. 游程检验
目的:用样本对总体进行估计时,样本必须是随机的,用于检验赝本的随机性
游程:用某种标准将样本分为两类,按照出现的顺序排列,联系出现的同一种观测值成为一个游程。游程数目太多或者太少都应该否定随机性。
注意:游程检验可以用于检测两样本是否抽自同一总体,方法为将他们混合排序,若抽自同一总体,序列应为随机的。
4. 秩相关检验
目的:用于检验两个指标间相关性,如抽取样本容量为n,每一个体测定X.Y两个指标,检验XY之间的相关性
注意:如果已知总体非正态分布,又没有合适的变换方法可使他为正态,则应使用秩相关检验
5. 小结
非参数检验一般精度都不够高,不能充分利用原始数据,但是非参数检验在统计学中仍占有一定位置,主要是他们对于总体分布没有特别要求;如果样品足够(100+),总体为正态分布的要求一般不是问题,因为此时中心极限定理保证了其平均数近似服从正态分布;如果是小样本、非正态分布的情况下,可以使用非参数检验。