- 博客(7)
- 收藏
- 关注
原创 Seq-SetNet补充
在这里,我们将含有K个同源蛋白的MSA表示为K对齐,每个对齐由一个同源蛋白对齐到目标蛋白上。对于每个单独的比对,MSA编码器识别目标蛋白每个残基的突变,并将突变嵌入到64个特征的载体中。由于残基的变异与邻域残基的变异密切相关,因此MSA编码器在嵌入过程中应将感兴趣的残基与其邻域残基一起考虑。为此,我们将编码器设计为一个具有多个卷积层的一维卷积残差网络,从而使其能够将残差与其邻居嵌入在一起。
2023-08-14 18:20:22
119
原创 Seq-SetNet:直接利用多序列比对预测蛋白质二级结构
这里提出的蛋白质二级结构和扭转角预测的结果突出了直接使用MSA作为序列集的特殊功能。Seq-SetNet利用深度网络可以从复杂的MSA数据中自动提取相关特征的能力,而无需任何手工特征。虽然在概念验证研究中,我们展示了Seq-SetNet在预测残基的二级结构和扭转角中的应用,但该概念和基本思想可以扩展到阐明残基-残基接触和距离。在未来的研究中,这将被纳入Seq-SetNet,这将极大地促进蛋白质结构预测。
2023-05-19 12:08:49
2108
3
原创 基于改进通道注意力和多尺度卷积模块的蛋白质二级结构预测
为了防止预测模型随着权重的增加而过度拟合,本文根据二次结构的特点,引入了一种改进的交叉熵函数来提高预测模型的性能,使预测模型在one-hot分布和均匀分布的情况下都能得到满意的性能。每个氨基酸转换成大小为1×21(21:20个氨基酸和一个用X表示的未知氨基酸)的OneHot形式,其中只有两个元素,值为0或1,值1的位置对应氨基酸的类别。模型中一维卷积的运算过程如图所示,其中卷积信号为700×M矩阵,卷积信号的滤波器大小为N×M,因为输出大小取决于卷积信号的个数(R),所以输出信号的大小为700×R。
2023-05-13 11:14:30
1126
原创 RGN2:基于语言模型和深度学习的单序列蛋白质结构预测
34%的目标的结构是使用NMR实验确定的,并用深灰色标记表示,而剩余的66%的目标是使用X射线晶体学或电子显微镜确定的。XRD,X射线晶体学。在本文中,我们描述了实施和培训的AminoBERT,使用Frenet-Serret公式在RGN 2和性能评估的天然和设计的蛋白质没有显着的序列同源物。作者对修订后的124个从头蛋白质靶点集和作者设计的蛋白质集(表A)进行了RGN2和ESM-1b之间的contact预测比较分析,这些表格显示了top L/2、L/5和L/10的contact的百分比精度。
2023-05-10 17:06:02
980
1
原创 RGN2模型
换句话说就是,首先要对原始数据进行初步的处理,输入的不是直接的原始数据,而是在原始数据中人工参与提取的一些关键特征。而非端到端呢,就是输入不是直接的原始数据,而是在原始数据中提取的特征(如feature),这一点在图像问题上尤为突出。通过这种方式神经网络可以很好地学习到特征的描述,之前需要人工设计的特征算子,本身也可以通过神经网络的方式,让模型自己学习得到。端到端它缩减了人工预处理和后续的处理工作,尽可能使模型从原始输入到最终的输出,给模型更多可以根据数据自动调节的空间,增加了模型的整体契合度。
2023-05-10 11:14:22
193
1
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人