一、背景
用于实验组和对照组是否有显著性差异。
二、理论
具体计算细节可参考参考资料中的代码实例计算过程。分为H0假设和H1假设。
2.1 零假设
零假设:在统计学中,零假设(虚无假设)是做统计检验时的一类假设。零假设的内容一般是希望证明其错误的假设。比如说,在相关性检验中,一般会取“两者之间没有关联”作为零假设,而在独立性检验中,一般会取“两者之间有关联”作为零假设。
2.2 备择假设
与零假设相对的是备择假设(对立假设,英语:alternative hypothesis),即希望证明是正确的另一种可能。也可以理解为零假设的其余可能结果。
三、相关参数
3.1 P值计算
P值来自于F统计量
3.2 T值
T检验, 需要满足正太分布的条件
https://baike.baidu.com/item/t%E6%A3%80%E9%AA%8C/9910799?fr=aladdin
3.3 F值计算
F=ESS(⋅)KRSS(⋅)N−K−1 \footnotesize {F} = \frac{\frac{\rm{ESS(\cdot)}}{K}}{\frac{\rm{RSS(\cdot)}}{N-K-1}} F=N−K−1RSS(⋅)KESS(⋅)
ESS(⋅)\footnotesize {\rm{ESS}(\cdot)}ESS(⋅) 表示回归平方和:y\footnotesize yy 回归值减去y\footnotesize yy 均值后差的平方和RSS(⋅)\footnotesize {\rm{RSS}(\cdot)}RSS(⋅) 残差平方和:y\footnotesize yy 值减去y\footnotesize yy回归值之差的平方和。 F值的意义是用来检验样本的结果能够代表总体的真实程度。也就是常说的求样本p值,当p值的结果为0.05≥p>0.01\footnotesize 0.05≥p>0.010.05≥p>0.01被认为是具有统计学意义,或结果为0.01≥p≥0.001\footnotesize 0.01≥p≥0.0010.01≥p≥0.001被认为具有高度统计学意义。
四、代码调用
from scipy import stats
t, p = stats.ttest_ind(experi_group, control_group)
计算出的值与0.05做比较,如果大于0.05则不具有显著性差异,接受原来假设。
五、问答
5.1 T检验为什么只适用于小样本
因为t检验分布表中的自由度只有1-60是精确地,再往后的t值都只有自由度为120和正无穷的值可查。也就是说,越大的样本,自由度越大,t值的检验越不精确。所以t检验不适合太大样本。
五、参考资料
https://blog.youkuaiyun.com/ChenVast/article/details/82797532
https://zhidao.baidu.com/question/423048325.html
https://jingyan.baidu.com/article/642c9d3412e2f2644a46f7f6.html (假设检验案例)
https://zhidao.baidu.com/question/145587664.html
https://zhuanlan.zhihu.com/p/30511458 (推荐)
https://www.jianshu.com/p/74a1e171588a(具体值的计算)
https://zhuanlan.zhihu.com/p/86188571(T检验具体值计算)
https://baike.baidu.com/item/t%E6%A3%80%E9%AA%8C/9910799?fr=aladdin (T检验具体值计算)
https://baike.baidu.com/item/F%E6%A3%80%E9%AA%8C/9910842 (F检验)
https://icode.best/i/73044143730112 (F检验,Pvalue值)
https://zhidao.baidu.com/question/112336361.html(自由度)
https://www.cnblogs.com/haore147/p/3630212.html(F与T区别)
https://blog.youkuaiyun.com/grl18840839630/article/details/120508886 (具体值的计算)
https://www.chemalink.net/college/books/reader/13/250.html (alpha=0.05 F分布表)
https://blog.youkuaiyun.com/zijinmu69/article/details/80564566?spm=1001.2101.3001.6650.1&utm_medium=distribute.pc_relevant.none-task-blog-2%7Edefault%7ECTRLIST%7ERate-1-80564566-blog-120508886.pc_relevant_multi_platform_featuressortv2dupreplace&depth_1-utm_source=distribute.pc_relevant.none-task-blog-2%7Edefault%7ECTRLIST%7ERate-1-80564566-blog-120508886.pc_relevant_multi_platform_featuressortv2dupreplace&utm_relevant_index=2 (计算公式)
https://github.com/jinhualee/datashine/blob/master/statsmodels_ols.ipynb(代码实例计算过程)
https://www.cndzys.com/shenghuoyangsheng/changshi/1934167.html(双侧T检验)
https://blog.youkuaiyun.com/qq_36056219/article/details/112155295(双侧T检验和单侧T检验)
https://zhuanlan.zhihu.com/p/93347847(案例)
http://www.datasoldier.net/archives/1410(是否要用Z检验)