33、蛋白质二级结构预测与结合补丁形状匹配研究

蛋白质二级结构预测与结合补丁形状匹配研究

蛋白质二级结构预测实验

在蛋白质二级结构预测中,为评估不同的结构到结构分类器,使用了CB513数据集,该数据集包含513个序列,由84119个残基组成。残基描述 $x_i$ 的推导已详细说明,其标签 $y_i$ 最初由DSSP程序进行二级结构分配,并按照CASP方法从8种构象状态简化为3种,即 $H + G → H$(α - 螺旋),$E + B → E$(β - 链),其他状态归为 $C$(无规卷曲)。

使用两个滑动窗口,分别以目标残基为中心,大小分别为13(序列到结构)和15(结构到结构,$T_l = T_r = 7$)。参考性能由包含两个多层感知器(MLP)的级联架构提供,其隐藏层大小分别为16(序列到结构)和6(结构到结构)。

为评估预测准确性,计算了三个最常用的标准指标:识别率 $Q_3$、Pearson - Matthews相关系数 $C_{α/β/coil}$ 和最新版本的片段重叠度量($Sov‘99$),概率估计质量通过(平均)交叉熵($CE$)衡量。采用七折交叉验证程序训练级联的两个层次并评估性能,每次使用三分之二的训练集训练序列到结构分类器,三分之一训练结构到结构分类器。实验结果如下表所示:
| 级联架构 | $Q_3$ (%) | $C_α$ | $C_β$ | $C_{coil}$ | $Sov‘99$ (%) | $CE$ |
| — | — | — | — | — | — | — |
| MLP + MLP | 74.6 | 0.69 | 0.59 | 0.54 | 71.1 | 0.615 |
| M - SVMs + 逻辑回归 | 76.5 | 0.71 | 0.62

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值