分子动力学轨迹的空间聚类方法研究
在蛋白质研究领域,理解蛋白质在展开过程中氨基酸残基的行为至关重要。传统的聚类技术在处理氨基酸残基的同步行为时存在不足,因此本文提出了一种新的轨迹空间聚类方法,用于分析甲状腺转运蛋白(Transthyretin,TTR)在展开过程中氨基酸残基(AARs)的同步轨迹。
传统聚类技术的局限性
传统聚类技术不够灵活,无法设置额外的限制条件,也不能让一个元素(残基)出现在多个聚类中。因此,它们不能很好地捕捉与多组其他残基同步出现的残基的行为。
轨迹空间聚类方法概述
该方法受频繁项集挖掘(Frequent Itemset Mining,FIM)技术的启发,主要分为三个步骤:
1. 确定刚性链接 :找出在模拟过程中距离变化小的AAR对,这些对将成为更大聚类的种子。
2. 聚类扩展 :逐步将这些聚类与其他AAR扩展,如果聚类元素的距离变化超过用户设定的阈值,则停止扩展。
3. 聚类过滤 :可选步骤,去除冗余聚类并合并相似聚类,然后根据聚类的cdv值进行排序。
方法详述
问题形式化
目标是设计一种方法,发现模拟过程中具有同步轨迹的残基集合(聚类)。为了衡量两个残基之间的距离变化,引入了距离变化系数(coefficient of distance variation,cdv)。如果两个AAR的cdv不超过用户定义的阈值cdvmax,则认为它们形成同步聚类。同时,为了处理聚类扩展时cdv值的增加,引入了参数cdvinc,表示每次扩展时c
超级会员免费看
订阅专栏 解锁全文
1027

被折叠的 条评论
为什么被折叠?



