提升无监督基因网络推断的学习框架
1. 链接预测算法步骤
链接预测算法包含五个步骤:
1. 创建推断子图 :假设算法旨在预测从节点/基因 u 到节点/基因 v 是否存在链接。存在两种情况。情况 1:基因对 (u, v) 在 G+ 中。算法调用 GeneProbe,以 G+、起点 u 和终点 v 作为输入,创建推断子图 I+ ⊆ G+。此外,算法在 G - 中随机选择一对基因 x, y,调用 GeneProbe,以 G -、起点 x 和终点 y 作为输入,创建推断子图 I - ⊆ G -。情况 2:基因对 (u, v) 在 G - 中。算法调用 GeneProbe,以 G -、起点 u 和终点 v 作为输入,创建推断子图 I - ⊆ G -。此外,算法在 G+ 中随机选择一对基因 x, y,调用 GeneProbe,以 G+、起点 x 和终点 y 作为输入,创建推断子图 I+ ⊆ G+。为不失一般性,假设情况 1 成立,并以此描述后续步骤。此步骤创建了对偶图稀疏化 I+ 和 I -。
2. 创建样本图 :创建样本图 I’+ ⊆ I+,其中 I’+ 不包含测试基因对 (u, v),且 I’+ 中每条边的权重大于或等于 0.5。认为 I’+ 中的边质量更高,更可能是正实例。假设 I’+ 中有 K 条边,从 I - 中随机选择 K 条边,形成样本图 I’- ⊆ I -。在训练包括神经网络、随机森林和支持向量机的三个分类器时,将 I’+ 中的边作为正训练示例,I’- 中的边作为负训练示例。对偶样本图 I’+ 和 I’- 共同构成训练数据集。
3. 构建特征向量 :通过连接 u 和 v 的
超级会员免费看
订阅专栏 解锁全文
781

被折叠的 条评论
为什么被折叠?



