模糊逻辑在蛋白质结构生物信息学中的应用
1. 引言
蛋白质在生理条件下,会由给定的氨基酸序列折叠成独特的三维结构,而这一结构是理解蛋白质分子功能的关键。传统上,蛋白质结构通过X射线晶体学和核磁共振(NMR)等实验方法确定,这些方法虽能得到高分辨率结构,但耗时且成本高,确定一个蛋白质的结构可能需要数月甚至数年。
随着测序技术的进步,每年有大量完整基因组被测序,产生数百万需要确定结构的蛋白质,显然大部分蛋白质结构无法通过实验方法确定。因此,通过计算预测蛋白质结构成为一种替代方法。该方法以蛋白质的氨基酸序列(一级结构)为输入,输出其三维结构。尽管技术有所进步,但这些计算方法通常只能提供低分辨率的结构,不过低分辨率的预测结果仍能为蛋白质功能和设计提供有用信息,且与实验方法结合使用时,可显著加快结构确定过程并降低成本。
由于直接预测蛋白质的三维结构具有挑战性,研究人员开始关注重要的中间步骤,如二级结构预测和溶剂可及性预测。一旦预测出蛋白质的结构,就可以通过结构特征来表征其功能,或者在已知结构和功能的蛋白质数据库中搜索结构同源物来预测蛋白质的功能。
1.1 二级结构预测的重要性
蛋白质的三维结构可以直接从一级序列预测,也可以利用蛋白质的二级结构进行预测。二级结构在表征蛋白质结构和为三级结构预测提供基础方面起着重要作用。它为计算方法提供了约束条件,大大减少了搜索空间,使预测更加高效和快速。通过在预测三级结构之前先预测二级结构,模拟了蛋白质折叠途径中的自然顺序,即二级结构形成后通常会折叠成三维紧凑结构。因此,二级结构预测的研究是蛋白质三维结构预测的关键部分。
1.2 溶剂可及性预测的作用
另一个有助于表征蛋白
超级会员免费看
订阅专栏 解锁全文
18

被折叠的 条评论
为什么被折叠?



