蛋白质序列结构模式发现与聚类支持向量机在结构预测中的应用
在蛋白质研究领域,发现蛋白质序列 - 结构模式以及准确预测蛋白质局部三级结构是至关重要的研究方向。下面将为大家详细介绍相关的研究内容和方法。
蛋白质序列 - 结构模式发现
在蛋白质中,发现具有可变二级结构的序列 - 结构模式(SSP)是一项具有挑战性的任务。以锌指结构域和细胞色素 c 家族蛋白质为例,我们可以看到不同的情况。
锌指结构域示例
在锌指结构域中,通过对残基的结构比对,发现了一些有趣的现象。例如,在图 3a 中,箭头之间的区域显示了第二个半胱氨酸残基周围结构域的主链变化。尽管两个半胱氨酸的侧链明显对齐,但从这种结构比对产生的序列比对中,这两个半胱氨酸并不在同一位置。在图 3b 中,箭头指示的两个苯丙氨酸残基在序列比对中相隔三个位置,但在锌指结构域的结构中占据相同的位置。
通过识别这些偏移残基作为结构域中合法的保守元素,创建了新的 SSP(SSP95022):[AIHTYFV]-x(1)-C-x(2,5)-C-x(1,6)-[IYF]-x(5,7)-[RFYMIL]-x(2)-H-x(3,5)-H。该模式相对于 ASTRAL100 的精度为 96.2%,召回率为 98.0%,相比 PROSITE 锌指特征的 80.5% 精度和 93.1% 召回率有了显著提高。
细胞色素 c 示例
对于细胞色素 c 家族的蛋白质,原始的 SSP 方法在结构域中识别出了一些在序列和结构上高度保守的位置,除了短的 PROSITE 模式中的位置。然而,得到的 SSP(SSP91008)并不能匹配 ASTRAL100 中所有已知的细胞色素 c 蛋白质。与
超级会员免费看
订阅专栏 解锁全文
1080

被折叠的 条评论
为什么被折叠?



