生物信息学图分析与几何树距离计算的研究进展
在生物信息学和计算机科学领域,图分析和几何树距离计算是两个重要的研究方向。本文将介绍图复杂度计算方法在生物信息学数据集上的性能评估,以及几何树距离计算的复杂度问题。
1. 图复杂度计算方法的性能评估
在生物信息学研究中,图被广泛用于表示生物分子结构和相互作用。为了评估图的复杂度,研究人员提出了基于Jensen - Shannon散度的深度复杂度轨迹方法,使用Shannon(JSCTS)或von Neumann(JSCTV)熵进行计算。
1.1 数据集介绍
- PPIs数据集 :包含219个蛋白质 - 蛋白质相互作用(PPI),收集自5种不同的细菌。从中选取了Proteobacteria 40个PPI和Acidobacteria 46个PPI作为测试图,所选图的顶点最大、最小和平均数量分别为238、6和109.60。
- D&D数据集 :包含1178个蛋白质结构,每个蛋白质用图表示,节点为氨基酸,距离小于6埃的节点相连。任务是将蛋白质结构分类为酶和非酶,顶点最大和平均数量分别为5748和284.32。
- ENZYMES数据集 :基于表示蛋白质三级结构的图,包含来自BRENDA酶数据库的600个酶。任务是将每个酶正确分配到6个EC顶级类别之一,顶点最大和平均数量分别为126和32.63。
1.2 性能比较实验
研究人员使用10折交叉验证结合SMO - 支持向量机分类对提出的方法和几种先进的
超级会员免费看
订阅专栏 解锁全文
2140

被折叠的 条评论
为什么被折叠?



