氨基酸与多肽几何结构的批判性分析
1. 模型文件数量分布
在研究中,我们关注了包含不同数量模型的文件在不同年份的分布情况。其中,包含单个模型的文件数量在1999 - 2000年达到最多,有73个;而从2005年开始,这类文件仅创建了27个。这一数据分布能让我们了解不同时期研究中对单个模型文件的使用频率变化。
2. 从病理角度看首个模型的“代表性”
此前的研究发现了一些“病理”pdb文件,这些文件中部分原子的坐标明显错误,还存在一些如平面法则方面的偏差。我们推测这些问题可能是由于首个模型不具代表性导致的,因此决定对此进行验证。
- 偏差文件筛选 :我们对共价键长度相对均值偏差超过15%的30个文件进行研究。其中12个文件仅包含一个模型,这意味着在这些情况下无法借助其他模型来改进数据。例如,“记录”文件2PDE.pdb的偏差超过700%,就属于这类情况。
- 多模型文件分析 :剩下的18个文件中模型数量分布如下:
|模型数量|文件数量|
| ---- | ---- |
|9|1|
|10|3|
|11|1|
|16|2|
|20|7|
|21|1|
|34|1|
|35|1|
|81|1|
我们从模型数量最多的文件开始分析,寻找其中存在明显病理的文件:
- 文件1MZI :包含81个模型,但其首个模型的偏差并未导致氨基酸形态出现明显偏差。
- 文件1OT4 :有3
超级会员免费看
订阅专栏 解锁全文
5319

被折叠的 条评论
为什么被折叠?



