利用加权准二部图挖掘生物交互网络
1. 引言
蛋白质是介导细胞过程(如转录、复制、代谢催化或物质运输)的分子机器的基本组成部分。在这些过程中,蛋白质相互作用,形成复杂的蛋白质 - 蛋白质相互作用(PPI)网络模块。分析这些网络是蛋白质组学中的一个热门领域,对生物学、药理学和医学等诸多问题有着广泛的影响。
然而,PPI网络存在不完整和容易出错的问题,这使得可靠地识别网络模块变得困难。蛋白质 - 蛋白质相互作用的测量无法达到基因组序列那样的精度,一些相互作用具有高度瞬态性,只能间接测量,而功能相互作用甚至不一定通过物理相互作用实现。因此,用于捕捉模块性的计算方法不能直接依赖于PPI网络中相互作用的存在与否,需要能够应对较高的错误率。
过去,未加权的准二部图方法被用于识别PPI网络中的模块性,但这些方法对PPI网络固有的定量不确定性很敏感。它们容易忽略许多低于用户指定阈值的宝贵蛋白质 - 蛋白质相互作用,并将所有高于阈值的相互作用同等对待。此外,由于测量中的一些看似微不足道的误差,某些相互作用可能未被表示出来,导致许多关键模块可能被隐藏而无法被检测到。
为了解决这些问题,我们引入了新颖的加权准二部图问题,通过使用边权重表示蛋白质 - 蛋白质相互作用水平的二分图来分析生物网络。我们证明了这些问题与未加权版本一样是NP难的,但我们提供了精确的整数规划(IP)解决方案来解决这些问题。我们的IP解决方案利用了PPI网络在表示为二分图时的典型稀疏性,能够处理中等规模的网络。
2. 相关工作
PPI网络可以表示为二分图,其中最大二部图是表征高度交互蛋白质复合物的自包含元素,通常代表PPI网络中的模块。然而,二部图对于识别PPI网络中的
超级会员免费看
订阅专栏 解锁全文
930

被折叠的 条评论
为什么被折叠?



