生物信息学中的元数据与本体论
1. 基因本体论(GO)概述
基因本体论(GO)包含三个结构化词汇表,其中的 GO 术语相互连接构成有向无环图(DAG),代表一个网络。这些术语的定义借助了《牛津分子生物学词典》等生物学资源。
1.1 GO 本体结构
- 术语关系 :DAG 中节点间的父子关系通过“is a”或“part of”来建立。“is a”描述更通用术语的特定实例,如“细胞核(GO:0005634)是‘细胞内膜结合细胞器(GO:0043231)’的一个实例”;“part of”指更高层次概念的组成部分,例如“细胞生长(GO:0016049)是‘细胞大小调节(GO:0008361)’的一部分”。
- 灵活性 :与层次树相比,DAG 结构更灵活,能更好地捕捉生物现实。正在开发的三个 GO 本体被组合到一个名为“all”的单一节点中。
1.2 本体修订规则
GO 联盟成员可对本体进行修订,但需遵循严格规则以确保更新版本的一致性:
1. 从子术语到其顶级父术语的路径必须为真。
2. 术语不应具有物种特异性,应适用于多个分类类或生物体。
3. GO 属性必须附有适当的引用。
2. 基因产物注释
基因目录制定完成后,策展人可根据文献和其他资源的信息为许多基因提供功能注释。每个基因与一组 GO 术语的关联必须准确执行,以确保过程的正确性。关联文件会在每个基因组数据库中独立于 GO 版本进行更新,并且对一个基因产物在一个本体中的注释独立于该基因在其他两个
超级会员免费看
订阅专栏 解锁全文
10

被折叠的 条评论
为什么被折叠?



