基于PPI网络拓扑和蛋白质复合物信息的必需蛋白质预测
1. 引言
蛋白质若对生物体的生存不可或缺,则被定义为必需蛋白质。识别必需蛋白质对于理解细胞生存和发育的基本要求至关重要。研究实验发现,必需蛋白质的进化速度比其他蛋白质慢得多,这表明它们在生物体的基本功能中起着关键作用。基于此,一些生物学家认为低等生物的必需蛋白质与人类疾病基因相关。
然而,传统的实验方法,如创建条件性敲除,在一次实验中难以发现大量必需蛋白质,且实验成本高昂。因此,许多必需蛋白质,尤其是人类的必需蛋白质,仍然未知。与此同时,蛋白质 - 蛋白质相互作用(PPIs)等生物数据正随着高通量技术的发展而快速增长且易于获取。
2001年,Jeong H等人提出了中心性 - 致死性规则,表明PPI网络中度数高的蛋白质更有可能是必需蛋白质。此后,基于网络拓扑的中心性度量成为识别必需蛋白质的重要方法。但近期研究指出,许多必需蛋白质的连接性较低,难以通过中心性度量来识别。因此,许多研究开始关注结合PPI网络和其他生物信息来识别必需蛋白质。
2. 方法
2.1 六种中心性度量
PPI网络可以表示为一个无向图G(V, E),其中蛋白质为节点,相互作用为边。蛋白质的中心性用于表征其对PPI网络全局结构或配置的重要性或贡献。常见的六种用于预测蛋白质必需性的中心性如下:
1. 度中心性(DC) :蛋白质i的度中心性DC(i)是与i相互作用的蛋白质数量。公式为:$DC(i) = |N(i)|$,其中N(i)是蛋白质i的邻居集合。
2. 介数中心性(BC) :蛋白质k的介数中心性B
超级会员免费看
订阅专栏 解锁全文
2345

被折叠的 条评论
为什么被折叠?



