氨基酸和多肽几何结构的批判性分析与度量研究
在对氨基酸和多肽的研究中,我们旨在比较相同类型氨基酸在相同或不同多肽中的几何结构。然而,在处理PDB文件以及进行度量分析时,我们遇到了一系列问题。
1. PDB文件处理的困难
在处理PDB文件时,我们遇到了多种困难,以下是详细的处理步骤和问题分析:
1. 氢信息缺失 :并非所有PDB文件都包含氢的信息,像X射线分析等一些研究多肽空间结构的方法就无法提供氢的信息。经过研究,我们发现核磁共振(NMR)方法最适合我们的研究目的。我们回到PDB数据库,在创建短名称列表的算法中,在“实验方法”字段标记NMR,这样得到的文件数量减少到约9000个,是原来的十分之一。
2. 缺少“ATOM …”字符串 :部分文件如1R9V.pdb、1S1O.pdb、1S4A.pdb、2KVJ.pdb只包含“HETATM …”形式的字符串,我们将这些文件从列表中删除。
3. 选择模型 :通常一个PDB文件包含同一多肽的多个变体(模型),每个模型以“MODEL N”开头,以“ENDMODEL …”结尾。我们决定选择每个文件中的第一个模型。处理文件时,我们删除从开头到第一个“ATOM …”字符串的所有内容,然后形成直到“TER …”的连续字符串列表。
4. 存在“HETATM …”字符串 :有些文件在“MODEL 1”和第一个“TER …”之间包含“HETATM …”字符串,这些字符串对应于非标准20种氨基酸的残基。我们找出了604个这样的文件并将其从列表中排除。
5. 替代
超级会员免费看
订阅专栏 解锁全文
1914

被折叠的 条评论
为什么被折叠?



