蛋白质亚细胞定位预测工具:mGOASVM、AD - SVM和mPLR - Loc
在蛋白质研究领域,准确预测蛋白质的亚细胞定位是一项关键任务。本文将介绍三种用于预测单定位和多定位蛋白质亚细胞位置的方法,分别是mGOASVM、AD - SVM和mPLR - Loc。
1. mGOASVM:单定位和多定位蛋白质预测器
mGOASVM在预测蛋白质亚细胞定位方面具有独特的优势,它与其他预测器不同之处体现在以下三点:
- 采用新的SVM分类器决策方案,能有效处理包含单标签和多标签蛋白质的数据集。
- 选择一组独特的相关GO术语,形成更具信息性的GO子空间。
- 使用GO术语的出现频率构建GO向量,而非使用1 - 0值。
1.1 特征提取
mGOASVM的特征提取方法与之前的GOASVM类似,但在搜索GOA数据库获取相关GO术语时,会使用多个同源蛋白质。在构建GO向量时,采用了词频方法,该方法被证明优于其他构建方法。
1.2 多标签多类SVM分类
为了预测包含单标签和多标签蛋白质数据集的亚细胞位置,mGOASVM采用了多标签支持向量机(SVM)分类器。具体步骤如下:
1. 对于一个M类问题(M为亚细胞位置的数量),训练M个独立的二元SVM,每个类对应一个。
2. 给定第i个查询蛋白质,第m个SVM的得分计算公式为:
[sm(ℚi) = \sum_{j = 0}^{n} wj(\sum_{r \in Sm} \alpha_{m,r}y_{m,r}K(p_r, q_{i,j}) + b_m)]
其中,$S_m$是对应第m个SVM的支持向量索引集,$\alpha
超级会员免费看
订阅专栏 解锁全文
1770

被折叠的 条评论
为什么被折叠?



