蛋白质结构预测方法全解析
1. 同源建模概述
同源建模是一种重要的蛋白质结构预测方法。其基本思路是从序列 B 的结构中选取与序列 A 比对区域相对应的片段,将序列 A 和 B 中不同的氨基酸进行突变,最终得到序列 A 的结构模型。这里,序列 A 的结构是目标结构,在建模时通常是未知的。
1.1 模板识别与初始比对
在这一步,需要在蛋白质数据库(PDB)中搜索具有已知结构的同源蛋白质。可以使用 BLAST 和 FASTA 等程序进行搜索,要求目标序列与可能的模板之间的同源性百分比足够高,以确保处于安全范围,这也是使用这些搜索程序的要求之一。
- BLAST 搜索 :这是一种搜索算法,能将查询序列与库或数据库中的序列进行比较,返回与查询序列匹配的序列,且匹配度高于一定阈值。它可以搜索蛋白质的氨基酸序列、DNA 和 RNA 序列的核苷酸。该算法由 Stephen Altschul 等人于 1990 年在《Journal of Molecular Biology》上发表,至今已被引用 50,000 次。
- FASTA 搜索 :这是一款主要用于 DNA 和蛋白质序列比对的软件。它采用局部序列比对的方式,先通过词命中模式和给定长度的词对匹配标记潜在匹配,再使用 Smith–Waterman 类型的算法进行搜索,执行速度较快。它还以其 FASTA 格式而闻名,该格式在生物信息学领域得到了广泛应用,由 William R. Pearson 和 David J. Lipman 于 1985 年开发。
为了获得与目标蛋白质同源的蛋白质列表,程序会使用以下两个矩阵将目标查询序列与
超级会员免费看
订阅专栏 解锁全文
1万+

被折叠的 条评论
为什么被折叠?



