蛋白质功能位点预测与分子描述符选择的研究进展
1. 蛋白质功能位点预测
1.1 生物基字符串选择方法比较
在蛋白质功能位点预测中,FRDissimilarity + DOR 基生物基字符串选择方法表现出色。与现有的 FRSimilarity 和 MInformation 基方法相比,虽然 FRSimilarity 和 MInformation 方法执行时间稍短,但 FRDissimilarity + DOR 基方法性能显著更优。具体表现如下:
- 统计显著性 :在 42 次比较中,FRDissimilarity + DOR 基方法均提供了明显更好的结果。
- 性能指标 :该方法在 α、β 和 γ 方面显著提高了现有方法的性能。
1.2 新型生物基函数(nBBF)性能
新型生物基函数(nBBF)在支持向量机(SVM)的预测准确性方面表现良好。nBBF 使用生物基字符串的影响区域或方差来归一化生物基字符串与子序列之间的不对称差异,而现有 BBF 使用生物基字符串的最大同源性得分。通过对不同蛋白质数据集的比较,nBBF 在 TNf、TPf、敏感性和准确性方面均提供了更好的结果,能更准确地将非数值序列空间转换为数值特征空间。
数据集 | 函数 | TNf | TPf | 敏感性 | 准确性 |
---|---|---|---|---|---|