生物信息学中的数据挖掘方法与技术
1. 生物信息学数据挖掘方法概述
在生物信息学领域,有两种重要的数据挖掘方法用于蛋白质结构预测,分别是环境模板法和接触势法。
环境模板法的核心在于确定每个已知结构核心中每个氨基酸的环境信息,这些环境信息包括埋藏状态的二级结构、极性、附近侧链的类型以及疏水性等。具体操作步骤如下:
1. 环境信息确定 :对每个已知结构核心中的每个氨基酸,分析其二级结构、极性、附近侧链类型和疏水性等环境因素。
2. 氨基酸频率统计 :统计不同环境下多个比对中不同氨基酸的出现频率。
3. 3D 结构轮廓创建 :利用统计得到的氨基酸频率创建结构 3D 轮廓。
4. 序列比对与预测 :使用动态规划算法将新序列与描述目标结构 3D 环境的描述符串进行比对。如果获得显著高的得分,则预测新序列具有与目标核心相似的折叠结构。
接触势法主要分析核心中氨基酸之间的数量和紧密程度。其操作步骤为:
1. 核心氨基酸分析 :分析核心中氨基酸的数量以及它们之间的紧密程度。
2. 接触矩阵表示 :将每个结构核心表示为 2D 接触矩阵。
3. 氨基酸相互作用评估 :评估查询序列中氨基酸之间的相互作用,这些相互作用应与核心中的相互作用相对应,并有助于蛋白质的稳定性。
4. 3D 结构预测 :假设能量最稳定的构象是最可能的
超级会员免费看
订阅专栏 解锁全文
1600

被折叠的 条评论
为什么被折叠?



