跨本体分析:结合基因本体中的关联和层次关系评估基因产物相似性
1. 引言
在生物知识发现领域,微阵列数据分析已成为主流。随着DNA、RNA和蛋白质序列及表达值的数量呈爆炸式增长,基因和基因产物相似性分析成为生物学家解读这些数据的主要方法。
当基因和基因产物以序列形式呈现时,通常会使用基于词的启发式方法来选择最大片段对的比对,类似于BLAST和FASTA算法对Smith - Waterman算法的近似。而当基因或蛋白质序列被映射到更高级的表示形式时,其他相似性方法也能为序列相似性测量提供额外的见解。
近年来,基因本体(GO)的影响力日益增强,一种新的评估基因或基因产物相似性的方法应运而生,即通过比较与之关联的基因本体代码注释来实现。基因本体提供了三个正交的功能基因组概念网络,分别编码基因和基因产物的生物过程(BP)、分子功能(MF)和细胞成分(CC)属性。使用GO代码注释来确定基因和基因产物的相似性,为BLAST和FASTA等方法增添了显著的额外功能。
目前,主要有两种基于GO的相似性评估方法:
- 基于层次关系的方法 :评估每个基因本体(BP、MF或CC)内共享的层次关系来确定GO代码的相似性。例如,两个生物过程的语义接近程度由它们在BP本体中最直接共同父节点的信息特异性决定。
- 基于关联关系的方法 :利用三个基因本体之间的关联关系来建立GO代码的相似性。这种关联关系可以预测特定生物过程最可能发生的细胞成分,以及最可能参与该生物过程的分子功能。
然而,这两种方法虽然互补,但由于测量方式的异质性,尚未有人尝试将它们结合起来。本文旨在提出一种名为跨
超级会员免费看
订阅专栏 解锁全文
12

被折叠的 条评论
为什么被折叠?



