基因组信息学中的无监督学习:从基序发现到miRNA调控网络推断
1. 基序发现
1.1 基序发现的输入数据类型分类
基序发现旨在从相关序列构建基序模型(如PFM),从计算角度,可根据输入数据类型分为以下几类:
1. 一组序列
2. 带有定量测量的一组序列
3. 一组直系同源序列
1.2 一组序列的基序发现
最经典的是从头基序发现,以一组序列为输入。这些序列通常是由共同转录因子调控的基因的启动子和增强子序列,或与共同转录因子相关的下一代测序峰周围的序列区域。以下是一些相关方法:
- AlignACE :Hughes等人提出的Gibbs采样算法,使用先验对数似然分数来采样和评估不同的基序模型。
- ANN - Spec :Workman等人提出的使用人工神经网络的机器学习方法。
- Consensus :Hertz等人利用最大信息含量原则贪婪搜索候选序列以构建基序模型。
- GLAM :Frith等人采用模拟退火方法进行多局部比对以构建基序模型。
- Improbizer :Ao等人使用期望最大化来确定DNA基序的PWM。
- MEME :Bailey等人提出,用于优化与基序模型信息含量相关的统计量的期望值。
- MUSI :一个包装MEME的参数枚举管道,用于阐明多种特异性结合模式。
无监督学习在基因组学中的应用
超级会员免费看
订阅专栏 解锁全文
98

被折叠的 条评论
为什么被折叠?



