利用短程相互作用和模拟遗传策略进行蛋白质接触图预测
1. 蛋白质接触图预测模型构建
在蛋白质接触图预测中,DTP 方法构建了一个大小为 NxN 的二维数组模型,这里的 N 是氨基酸的数量(为 20)。每个矩阵单元包含一个由决策树形成的函数 f(A1, A2, S),其输入向量由氨基酸对 (A1, A2) 以及从它们之间的子串 (S) 中提取的信息组成。对于未知序列 (S?),在构建好的模型中对每对氨基酸进行评估,通过判断是否存在接触来得到预测结果。
输入编码方案
决策树的输入编码方案如下:
| 编码类型 | 位置数量 | 说明 |
| ---- | ---- | ---- |
| 子链中氨基酸出现频率 | 20 个位置 | 表示子链中氨基酸出现的频率 |
| 子链氨基酸物理性质频率 | 7 个位置 | 代表子链氨基酸物理性质的频率 |
| 子序列中化学成分(原子)频率 | 5 个位置 | 体现子序列中化学成分(原子)的频率 |
| 氨基酸序列分离 | 1 个位置 | 表示氨基酸序列的分离情况 (Ss) |
| 蛋白质序列长度 | 1 个位置 | 记录蛋白质序列的长度 |
| 类别编码 | 1 个位置 | 编码为接触或非接触 |
决策树预测流程
graph LR
classDef startend fill:#F5EBFF,stroke:#BE8FED,stroke-width:2px
classDef process fill:#E5F6FF,stroke:#73A6FF,s
超级会员免费看
订阅专栏 解锁全文
42

被折叠的 条评论
为什么被折叠?



