解决网络富集分析中的广义最大权重连通子图问题
1. 引言
基因集富集方法广泛用于分析转录组、蛋白质组或代谢组等无靶向生物数据。这些方法能以基因集的形式识别数据中具有非随机群体行为的分子途径,确定这些过度富集的途径有助于深入了解数据和所研究的系统。
与基因集富集不同,网络富集方法不依赖预先定义的基因集,因此能够识别新的途径。这些方法使用基因、蛋白质、代谢物等相互作用实体的网络,试图找出最受调控的子网络。网络富集问题有不同的数学表述,其中许多是NP难问题。
Dittrich等人提出将其表述为最大权重连通子图(MWCS)问题。最初,他们考虑的是节点加权图,正权重对应“有趣”的节点,负权重对应“无趣”的节点,目标是找到节点权重总和最大的连通图,即“活跃模块”。
这里我们考虑一种稍有不同形式的MWCS:广义MWCS(GMWCS),它在代谢网络研究中自然出现。在这类网络中,图的节点代表代谢物,边代表它们通过反应的相互转化。与MWCS相比,GMWCS的边也被加权,节点可以使用代谢组学谱进行评分,边可以使用基因或蛋白质表达谱进行评分。
近年来,代谢调节的重要作用越来越受到认可,特别是在免疫系统和癌症研究中。这促使人们开发有效的计算方法来研究它,例如代谢网络富集。该方法会得到一个连通反应的子网络,这些反应被假设在所研究的过程中最为重要。利用这样的子网络,可以更好地理解相应的代谢调节,并推断其关键点。
本文将介绍一种用于解决节点和边都加权的GMWCS问题的精确求解器。
2. 形式定义
2.1 最大权重连通子图问题的两种形式
最大权重连通子图(MWCS)问题有两种稍有不同的表述。最常用的定义
求解广义最大权重连通子图
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



