基于松弛邻域的图变换用于蛋白质功能预测的有效预处理
1. 引言
在蛋白质功能预测领域,通过分析蛋白质相互作用(PPI)网络数据集来进行预测是一个重要的研究方向。传统方法在提取节点邻域和建立节点间相似性时,往往依赖于特定的相似性标准。然而,这些方法可能存在性能瓶颈,例如无法充分挖掘潜在的相似关系,或者容易引入噪声。为了改善这些问题,提出了一种基于松弛邻域的图变换方法,旨在提高蛋白质功能预测的准确性。
2. 方法原理
2.1 邻域提取与相似性建立
在PPI网络中,每个节点的邻域通常根据指定的相似性标准进行提取,而两个节点之间的相似性则基于共同邻居的数量来建立。不同的相似性标准会导致不同的邻域提取和相似性计算方法。
为了提高性能,提出了一种松弛邻域方法。该方法通过降低相似性阈值来提取更多的邻域节点,期望增加邻域内蛋白质的数量,从而建立更多的蛋白质间关系。然而,这种松弛的相似性可能会引入噪声关系。为了避免这种情况,在建立两个蛋白质之间的关系时,不仅要考虑共同邻居的数量,还要检查由共同邻居形成的子图的属性。
例如,在一个包含7个蛋白质的图中,使用连接两个蛋白质的路径上的边数作为距离度量来收集邻域节点。当路径距离为1时,节点的邻域节点较少;当路径距离为2时,邻域节点数量增加。通过比较不同路径距离下节点的共同邻居数量、Jaccard相似性和链接密度,可以决定是否在两个节点之间添加边。
2.2 具体方法
- 松弛邻域提取(Relaxed Neighborhood Extraction) :对于PPI网络中的每个蛋白质,使用松弛邻域相似性(
超级会员免费看
订阅专栏 解锁全文
1623

被折叠的 条评论
为什么被折叠?



