生物信息学中的智能体与数据挖掘及基于知识的强化学习
在生物信息学领域,数据挖掘技术正发挥着越来越重要的作用,但也面临着一些挑战。本文将介绍生物信息学中智能体与数据挖掘的相关应用,以及基于知识的强化学习在数据挖掘中的应用。
酶分类
ATUCG可用于根据酶委员会(EC)的顶级层次结构将酶分类为不同的功能类别,这对于尚未注释的蛋白质的功能研究具有重要意义。因为了解酶所属的家族或亚家族有助于确定其催化机制和特异性,为相关生物功能提供线索。
训练数据准备
- 从SWISS - PROT数据库中选取“DE”行标注有EC编号的所有蛋白质。
- 使用这些EC编号的第一位数字,共找到约60,000个标注有EC编号的蛋白质。
- 提取与InterPro结构域分类相关的AC作为属性,这些AC在SWISS - PROT中作为交叉引用数据库出现。每个SWISS - PROT条目对应一个学习实例,使用InterPro AC作为学习算法的属性。
| EC类 | 属性数量 |
|---|---|
| 氧化还原酶 | 715 |
| 水解酶 | 1269 |
| 异构酶 | 231 |
| 转移酶 | 1309 |
超级会员免费看
订阅专栏 解锁全文
1491

被折叠的 条评论
为什么被折叠?



