生物信息学中的智能体与数据挖掘
在生物信息学领域,数据挖掘和智能体技术的应用对于蛋白质注释和基因组分析至关重要。本文将介绍相关数据库、自动化注释环境、协商机制以及数据集选择等方面的内容。
1. 重要数据库介绍
- Interpro5 :集成了最常用的基序数据库,在这些数据库之上提供了一层抽象。它接收来自成员数据库的签名,手动将基序分组为家族,从而为给定的蛋白质家族、结构域或功能位点创建唯一、非冗余的特征描述。
- 酶数据库 :
- ENZYME :基于国际生物化学与分子生物学联盟(IUBMB)的建议,存储有关酶命名法的信息。酶使用EC(酶委员会)代码进行分类,一个给定的类别由四位数字组成,代表酶的功能。例如,1.1.1.1 表示醇脱氢酶。SWISS - PROT条目中的“DE”行包含与相应蛋白质相关的EC编号,这些编号是到ENZYME数据库的链接。
- BRENDA :另一个重要的酶数据库,即不伦瑞克酶数据库。
2. 基于智能体的自动化注释环境(ATUCG)
尽管有越来越多的工具用于分析DNA序列,但注释问题仍然没有简单的解决方案。ATUCG旨在为负责基因组测序和注释的团队提供一个工具,以促进这些任务的执行。
ATUCG由三层组成,每层都有多个智能体:
- 第一层(Layer I) :自动化寻找开放阅读框(ORF)的任
超级会员免费看
订阅专栏 解锁全文
1883

被折叠的 条评论
为什么被折叠?



