
统计学
red_west
这个作者很懒,什么都没留下…
展开
-
相关性分析
斯皮爾曼等級相關係數:無母數分析(non-parametric analysis)。直接使用資料數值算統計叫parametric方法,把資料排序之後用排序的名次算統計叫non-parametric方法。斯皮爾曼等級相關係數前提假設:無。皮爾森相關係數分析類型:母數分析(parametric analysis)。直接使用資料數值算統計叫parametric方法,把資料排序之後用排序的名次算統計叫non-parametric方法。3.皮爾森相關係數前提假設:兩組變數之資料均為常態...原创 2020-10-14 09:42:40 · 362 阅读 · 0 评论 -
lefse分析
LEfSe(LDA Effect Size)分析,可以用于两个或多个分组之间的比较,从而找到组间 有显著性差异的物种(即 biomarker),分析步骤主要分为三步:Step1:利用 Kruskal-Wallis 秩和检验检测所有的特征物种,通过检测不同组间的物种丰 度差异,获得显著性差异物种。Step2:再利用 Wilcoxon 秩和检验检测上步获得的显著性差异物种的所有亚种是否都趋 同...原创 2020-03-24 16:49:45 · 7370 阅读 · 0 评论 -
哑变量处理
可以看到,该结果和model.matrix稍有区别,生成了四个虚拟变量。要注意,为了避免多重共线性,对于level=n的分类变量只需选取其任意n-1个虚拟变量。原创 2020-03-18 16:57:11 · 1409 阅读 · 0 评论 -
t检验
前提:正态性假设检验1.画QQplotlibrary(car)#QQ-plotqqPlot(lm(value~group,data=richness_12),simulate=TRUE,main='QQPlot',labels=FALSE)2.Shapiro-Wilk检验我们还可使用Shapiro-Wilk检验验证数据分布的正态性,它类似于线性...原创 2020-03-12 16:12:17 · 264 阅读 · 0 评论 -
t检验,卡方检验,方差分析与单因素回归分析等价
详见链接https://www.mediecogroup.com/method_topic_article_detail/158/原创 2020-03-05 16:40:41 · 2045 阅读 · 0 评论 -
lasso回归和ridge回归
LASSO回归复杂度调整的程度由参数λ来控制,λ越大对变量较多的线性模型的惩罚力度就越大,从而最终获得一个变量较少的模型。λ越大,变量越少。原创 2020-03-05 11:41:29 · 1863 阅读 · 0 评论 -
卡方检验chiq.test()
数据类型:因子型变量(患/不患肺癌,吸/不吸烟) 患肺癌 不患肺癌 合计 吸烟 60 32 92 未吸烟 3 11 14 合计 63 43 106 目的:研究吸烟是否与肺癌有关代码:x = c(60, 3, 32, 11)dim(x) =c(2, 2)chisq.test(x, ...原创 2020-03-05 10:54:52 · 1308 阅读 · 0 评论