蛋白质 - 碳水化合物相互作用的结构分析与数据验证
1. 蛋白质结构中碳水化合物的识别
在研究蛋白质结构中的碳水化合物时,整体数据的复杂性使得直接得出结论变得困难。不过,聚焦于特定氨基酸时,趋势就会变得明显。例如,在β - d - Gal周围,四种芳香族氨基酸(组氨酸(His)、苯丙氨酸(Phe)、色氨酸(Trp)、酪氨酸(Tyr))的分布和取向存在明显偏差,尤其是Trp残基。其他数量相当的单糖,如α - d - Glc和β - d - Man,也显示出有偏差且独特的氨基酸分布。
为了进一步研究,开发了一个脚本,将GlyVicinity输出的HTML数据转换为更便于三维研究蛋白质 - 碳水化合物相互作用(PCIs)的格式。这个脚本解析GlyVicinity的输出,并与PDB中的原始晶体结构进行交叉引用,以获取适当的坐标。同时,它还能纠正GlyVicinity输出中的一些错误,处理数据集中的冗余问题。具体操作步骤如下:
1. 去除重复条目 :从GlyVicinity输出中移除重复的条目。
2. 修正错误标签 :识别与已识别碳水化合物对应的残基标签错误分配的情况,并尝试使用记录的原子标签找到正确的残基。
3. 排除特定情况 :排除晶体结构中整个寡糖被赋予单个标签的情况,以避免确定GlyVicinity所指单糖时出现问题。
4. 去除重复结合位点 :识别近端氨基酸的组成,排除那些氨基酸组成相同的情况,以防止数据集中出现偏差。对于不同蛋白质中尽管相互序列同一性低于阈值但结合位点几乎相同的情况,由于可能是由于相同的保守碳
超级会员免费看
订阅专栏 解锁全文
35

被折叠的 条评论
为什么被折叠?



