泊松分布的单样本学习与高斯混合模型的同步选择算法
在实际的数据处理和分析中,我们常常会遇到样本量极小的情况,比如在检测差异表达基因时。同时,在高斯混合模型学习中,模型选择和特征选择也是至关重要且具有挑战性的问题。下面我们将详细探讨泊松分布的单样本学习以及高斯混合模型的同步选择算法。
泊松分布的单样本学习
Audic - Claverie统计量中的贝叶斯平均
从cDNA文库中随机选取N个克隆,对于给定的信息(标签),用x表示其被选取的次数。重复该实验(可能在不同条件下),再次随机选取N个克隆并生成序列标签,该信息会被选取y次。在原假设下,我们关注的是已经观察到x次的克隆再出现y次的概率。对于代表文库中一小部分的转录本和大量的克隆数N,观察到同一基因的x个标签的概率可以用参数为λ ≥ 0的泊松分布很好地近似:
[P(X = x|\lambda) = \frac{e^{-\lambda} \lambda^x}{x!}]
未知参数λ表示cDNA文库中每N个克隆中给定类型(标签)的转录本数量。
给定来自同一(未知)泊松分布的观察计数x,计数y的概率为:
[P_{AC}(y|x) = \int_{0}^{\infty} P(y|\lambda) p(\lambda|x) d\lambda = \int_{0}^{\infty} P(y|\lambda) \frac{P(x|\lambda) p(\lambda)}{\int_{0}^{\infty} P(x|\lambda’) p(\lambda’) d\lambda’} d\lambda]
对泊松参数λ施加平坦(不合适)先验p(λ),得到:
[P_{AC}(y|x)
超级会员免费看
订阅专栏 解锁全文
2万+

被折叠的 条评论
为什么被折叠?



