蛋白质结构家族分类与子图挖掘技术
蛋白质结构的准确分类在生物信息学领域中至关重要。本文将介绍蛋白质序列聚类和结构家族分类的相关研究,涉及球蛋白和G蛋白偶联受体(GPCRs)的聚类分析,以及基于连贯子图挖掘的蛋白质结构家族分类方法。
球蛋白序列聚类分析
- 聚类结果 :对91个SCOP球蛋白序列进行聚类,不依赖预定义的阈值,结果反映了潜在的SCOP分类。其中,a.l.l.1形成一个单一聚类,a.1.1.2有九个单独的聚类(包括4个单例),a.1.1.3为一个单一聚类,a.1.1.4为一个单例。
- 结构信息的影响 :在聚类中加入结构信息后,聚类模式发生变化,从大量功能相关序列的小聚类变为数量较少的聚类,能更清晰地分离SCOP球蛋白家族的成员。
G蛋白偶联受体(GPCRs)聚类分析
- GPCRs分类系统 :根据GPCRDB分类系统,GPCR超家族分为5个主要类别(A - E),每个类别进一步分为1级和2级亚家族。部分GPCRs为“孤儿”受体,其天然配体未被识别。
- 相关计算方法 :其他作者采用了不同的计算方法对GPCRs进行分类,如使用支持向量机、系统发育树、基于氨基酸理化性质的向量转换等。
- 实验数据与结果 :实验聚焦于Class A序列,数据集包含946个序列,其中303个为“孤儿”受体。使用无限高斯混合模型的聚类结果显示,由于该超家族的序列多样性,对角线上出现了更多小聚
超级会员免费看
订阅专栏 解锁全文
12

被折叠的 条评论
为什么被折叠?



