5、宏基因组聚类的双向贝叶斯混合模型与CRiSPy-CUDA工具

宏基因组聚类的双向贝叶斯混合模型与CRiSPy-CUDA工具

双向贝叶斯混合模型在宏基因组聚类中的应用

在宏基因组学中,为了对序列进行聚类分析,提出了一种双向贝叶斯混合模型。对于每个父节点的配置 $p_{aj}$,会得到一个独立的多项分布问题,相关参数如下:
- $\Theta = { \theta_m : \forall m \in 1, .., M }$
- $\theta_m = { \theta_{m,c}|p_{aj} : \forall p_{aj} \in { p_{a1}^j, p_{a2}^j, .., p_{ap}^j } }$
- $Mult(\theta_{m,c}|p_{aj}) = \theta_{m,c}|p_{aj} = { \theta_{m,ck}|p_{aj} : \forall c_k \in (A, C, T, G) }$

数据的似然函数为:
$p(x_i|y_i = m) = p(x_i|\theta_m) = \sum_{p_{aj}} \sum_{c_k \in (A,C,T,G)} \theta_{m,ck|p_{aj}}^{N_i(c_k|p_{aj})}$

在实验中,由于宏基因组学缺乏标准数据集,使用Metasim模拟合成宏基因组。生成了超过450个数据集,读取长度在50到1000个碱基对之间,且具有不同的丰度比。算法用Matlab实现,空间和时间复杂度与读取数和物种数呈线性关系,与搜索空间的维数呈二次关系。

为评估方法的鲁棒性,通过平均二核苷酸相对丰度 $\delta^ (f, g)$ 对双物种数据集进行排序:
$\delta^
(f

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值