基因组信息学中的无监督学习方法:miRNA 靶点预测与调控模块检测
1. 无监督学习方法概述
在基因组信息学中,有多种无监督学习方法用于 miRNA 相关研究,以下是一些常见方法的总结:
| 方法 | 算法 |
| ---- | ---- |
| PicTar | 隐马尔可夫模型 |
| TargetScore | 变分贝叶斯混合模型 |
| GroupMiR | 基于印度自助餐过程的非参数贝叶斯方法 |
| SNMNMF | 约束非负矩阵分解 |
| Mirsynergy | 确定性重叠邻域扩展 |
2. PicTar 方法
2.1 基本原理
PicTar(概率识别目标位点组合)是少数严格考虑同一目标 3’UTR 上组合 miRNA 调控的模型之一。它首先根据目标位点在特定物种间的保守性进行预过滤,其基本框架基于隐马尔可夫模型(HMM)和最大似然(ML)方法。
设 S 为 3’UTR 序列,L 为 S 的长度,w 为长度为 lw 的 miRNA “词” 的目标位点,pw 为 miRNA w 出现的转移概率,pb 为长度 lb = 1 的背景转移概率。为简化符号,将背景字母视为特殊词 w0。目标是获得 3’UTR 序列 S 中任意核苷酸位置 i 是词的最后位置的后验概率 p(ωi = w|S, θ)。
根据马尔可夫假设,p(ωi = w|S, θ) 与位置 i 前后的概率乘积成正比,可通过前向 - 后向算法在 O(L × K) 时间内计算。
前向算法推导如下:
[
\begin{align }
超级会员免费看
订阅专栏 解锁全文
1120

被折叠的 条评论
为什么被折叠?



