蛋白质分类与定位预测方法的性能评估
1. RP - SVM 的性能评估
1.1 集成随机投影的性能
通过留一法交叉验证,在病毒数据集和植物数据集上对 RP - SVM 和 RP - AD - SVM 在不同特征维度下的性能进行了评估。在病毒数据集上,原始特征向量维度为 331,当维度在 50 到 300 之间时,RP - SVM 的性能优于 mGOASVM,这表明即使维度仅为原始维度的六分之一,随机投影(RP)也能提升分类性能,说明原始特征向量存在无关或冗余信息。当维度大于 100 时,RP - AD - SVM 的性能与 AD - SVM 相当或更优,表明随机投影与自适应决策方案具有互补性。在植物数据集上,RP - AD - SVM 在更宽的特征维度范围(200 到 1541)内优于 AD - SVM,而在病毒数据集上,该范围较窄(100 到 300),说明 RP - AD - SVM 在植物蛋白分类上更稳健。
1.2 与其他降维方法的比较
将 RP - SVM 与 PCA - SVM 和 RFE - SVM 这两种降维方法在病毒数据集和植物数据集上进行比较。在病毒数据集上,当维度大于 50 时,RP - SVM 和 RFE - SVM 的性能优于 mGOASVM;当维度大于 100 时,PCA - SVM 才优于 mGOASVM,说明前两种方法比 PCA - SVM 更稳健。当维度高于 75 时,RP - SVM 优于 RFE - SVM 和 PCA - SVM。在植物数据集上,只有 RP - SVM 在较宽的维度范围内表现最佳,而 RFE - SVM 和 PCA - SVM 在维度降至 200 时表现较差。
超级会员免费看
订阅专栏 解锁全文
21

被折叠的 条评论
为什么被折叠?



