正文:https://www.nature.com/articles/s41586-021-03819-2
【公开课】基于AI预测蛋白质折叠的三维空间结构——AlphaFold2原理及安装使用_哔哩哔哩_bilibili

1. 搜索同源序列和模板:
去按序列数据库以及PDB数据库中去搜索同源序列和模板
给定序列A,到Uniref90、MGnify、Uniclust30、BFD数据库中搜索他的同源序列,从Unire90中得到MSA。然后到PDB70中搜索同源模板得到对应的mmCif文件
1)当相似度高于50%,常推测检测序列和目标序列有可能是同源序列。
2)MSA
MSA是Multiple Sequence Alignment的缩写,即多序列对齐,这个技术用于从一个大的数据库中抽取和输入氨基酸序列相近的序列,并且顺便进行对齐。抽取这个特征的原因是类似的氨基酸序列一般来说折叠方式也类似,相当于在特征中就加入了相近的序列结

本文详细解读了AlphaFold2如何利用AI预测蛋白质三维结构,包括同源序列搜索、MSA特征构造、Evoformer融合共变信息以及Loss计算方法。介绍了关键步骤如多序列对齐、深度学习输入表示和进化关系学习。
https://static-content.springer.com/esm/art%3A10.1038%2Fs41586-021-03819-2/MediaObjects/41586_2021_3819_MOESM1_ESM.pdf
最低0.47元/天 解锁文章
2574

被折叠的 条评论
为什么被折叠?



