似然比检验与分类器集成方法在生物与机器学习中的应用
1. 似然比检验在代谢物差异分析中的应用
1.1 代谢物差异统计检验的任务
在生物研究中,我们常常会遇到这样的情况:针对已识别的代谢物,在不同条件下进行测量得到两组样本。此时,我们关心的是这两组样本所代表的代谢物的真实(对数)强度 $\mu_1$ 和 $\mu_2$ 是否相同。如果有足够的统计证据表明这两个强度不同,那么这很可能意味着存在生物学原因导致了这种差异。
1.2 似然比检验的原理与方法
为了解决上述问题,我们采用似然比检验。该检验为原假设 $\mu_1 = \mu_2$(即所考虑的代谢物在两种条件下的表达水平相同)与备择假设(即真实强度不同)提供了一个 p 值。低 p 值意味着我们有很高的确定性拒绝原假设(即存在差异表达)。
似然比检验基于 Wilks 定理,统计量 $-2 \ln T$ 近似服从 $\chi^2$ 分布,其中:
[T = \frac{f_Y(Y | \tilde{\lambda}(\Lambda_0))}{f_Y(Y | \tilde{\lambda}(\Lambda_1))}]
$f_Y(Y | \tilde{\lambda}(\Lambda_0))$ 和 $f_Y(Y | \tilde{\lambda}(\Lambda_1))$ 分别是在参数向量 $\tilde{\lambda}(\Lambda_0)$ 和 $\tilde{\lambda}(\Lambda_1)$ 下样本 $Y$ 的似然函数。参数向量为 $(a, r, \lambda, \mu_1, \mu_2)$,对于 $\Lambda_0$,有约束条件 $\mu_1 = \m
超级会员免费看
订阅专栏 解锁全文
1334

被折叠的 条评论
为什么被折叠?



