结构基因组学进展与蛋白质结构预测方法
1. 结构基因组学概述
结构基因组学是一个具有工程和技术成分的领域,对生命科学有着巨大的潜在影响。与人类基因组计划目标相对明确(对构成人类基因组的30亿个核苷酸进行测序并确定所有开放阅读框)不同,结构基因组学的目标更加多样化。例如,一些NIH P50结构基因组学中心专注于特定基因组中的所有蛋白质结构,如拟南芥(A. thaliana)、海栖热袍菌(T. maritima)和结核分枝杆菌(M. tuberculosis)。其他团队则致力于获得足够的折叠空间覆盖,以促进对大多数具有生物学意义的蛋白质进行准确的同源建模。
开展结构基因组学研究可能会为生命系统带来新的理解,还可能推动结构测定过程的进步,无论是通过X射线晶体学还是核磁共振(NMR)技术。随着研究成果的多样性增加以及一些项目的稳步推进,一个明显的问题是:我们目前进展如何?
2. 研究方法
2.1 数据获取
结构基因组学的一个重要特点是参与高通量结构测定的试点中心需要定期报告进展。美国和全球的16个试点中心通过每周更新数据来实现这一点,这些数据由蛋白质数据库(PDB)汇总到目标数据库(TargetDB,http://targetdb.pdb.org)中。TargetDB的内容也可以以XML文件的形式获取,利用该文件创建了本地数据库(http://spam.sdsc.edu/sgtdb),本文的研究结果即来源于此。
2.2 折叠预测方法
折叠预测基于三种现有方法:FFAS、iGAP和贝叶斯网络。对完整蛋白质组中所有开放阅读框的预测使用iGAP方法,这也是生命百科全书(EOL,http://eol.sd
结构基因组学与蛋白质结构预测进展
超级会员免费看
订阅专栏 解锁全文
1093

被折叠的 条评论
为什么被折叠?



