基于图卷积的分子生物活性预测研究
1. 算法性能基础分析
F1分数综合考虑了模型的精确率和召回率,只有当这两个值都较高时,F1值才会更高,模型性能也更好。通过对不同基准模型在多个数据集上的ACC和F1分数指标结果分析发现:
- 基于图卷积的EAGCN比传统机器学习方法表现出更好的分类性能。其ACC指标比基准学习模型高2 - 8%,F1分数指标高1 - 5%。直接从分子图中获取信息而非预先计算的特征,能够提升模型性能。
- 在少数数据集上,DNN的性能与EAGCN基本相同或略高,RF有时也能达到与EAGCN相同的性能,这表明仍有很大的优化空间。
- 基于多特征融合的MF EAGCN模型表现出更优的分类性能,证明多特征融合方案能更好地利用边属性信息来提高模型预测性能。其ACC指标比EAGCN模型高1 - 2%,F1分数指标高约1%。
| Task | ACC | F1 - score | ||||||||
|---|---|---|---|---|---|---|---|---|---|---|
| Dataset | RF | SVM | DNN | EAGCN | EAGCN MF | RF | SVM </ |
超级会员免费看
订阅专栏 解锁全文
1225

被折叠的 条评论
为什么被折叠?



