论文笔记:EGAT: Edge Aggregated Graph Attention Networks and Transfer Learning Improve Protein-Protein In

本文提出了一种名为EGAT的新方法,它利用图神经网络和边缘特征来预测蛋白质的结合位点。EGAT通过改进的边聚合图注意力层有效地利用了蛋白质结构的局部和全局信息。实验结果表明,EGAT在多个基准数据集上优于其他先进技术,并且证明了使用预训练的ProtBERT特征进行迁移学习的价值。

一、摘要

图神经网络(GNN)已成为结构信息编码的一种有效工具,尽管基于GNN的体系结构已被应用于配对结合位点预测,但他没有被用来预测单个蛋白质的结合位点。此外,与可能不适当编码远程相互作用的残基特异性信息的方法不同,当它们学习所有残基的单一全局特征表示时gnn有潜力有效编码包含任何特定残基的全局特征,通过学习特定残基及其近邻的合适函数。在各种基于GNN的网络结构中,图注意网络(GAT)被证明是解决蛋白质相互作用网络相关问题的有效方法,但是最初提出的GAT体系结构并没有考虑边缘的特征,无论是在聚集过程中,还是在计算注意力分数时。因此,GAT缺乏利用可能已经编码在边缘特征中的丰富结构信息的能力,与GAT不同的是,EGAT被期望在聚合和注意力分数计算阶段有效地利用编码在边缘特征中的结构信息。

二、方法

(一)、蛋白质图的表示

本文提出的EGAT模型是一种基于图神经网络的结构,我们将数据集中每个蛋白P的三维结构表示为有向k近邻图G。图G中的节点集合V (G)是蛋白质P的氨基酸残基集合。设Ni是节点(残差)i的邻域,它由k个最近的邻域组成(即|Ni| = k), i是这个邻域的中心。每个节点i∈V (G)通过有向边连接到Ni中的每个节点。这些i的邻居是通过对所有其他节点根据它们到i的距离排序来选择的,然后取最近的k个节点,其中k是我们方法的超参数。受到蛋白质相互作用预测的成功启发。

(二)、节点级特征表示

每个节点i∈V (G)(表示i-蛋白质序列中的残基)用一个特征向量表示。EGAT将序列X = {X1, X2, X3,…, XN},其中Xi为第i个残基的一个字母符号,N为P中残基的总数,X通过所开发的嵌入生成管道。尽管我们在实验中使用了ProtBERT,因为与其他方法相比,它在残差级别分类任务(例如:第二结构预测),EGAT与ProtTrans[36]中可用的预先训练的语言模型无关,这意味着ProtTrans中其他适当的语言模型也可以用于我们的模型。

(三)、边级特征

由于没有具体的引用内容,以下是基于常见知识对EGAT - LSTM(这里推测你想问的是EGAT - LSTM,EGAT可能指图注意力网络相关的改进结构,LSTM是长短期记忆网络)的介绍。 ### EGAT - LSTM 模型介绍 - **LSTM(长短期记忆网络)**:LSTM是一种特殊的循环神经网络(RNN),能够解决传统RNN在处理长序列时的梯度消失或梯度爆炸问题。它通过引入门控机制,包括输入门、遗忘门和输出门,来控制信息的流动和记忆,使得网络能够更好地捕捉序列中的长期依赖关系。例如在自然语言处理中,处理句子时可以记住前面较远位置的重要信息,从而更好地理解句子的语义。 - **EGAT(推测为改进的图注意力网络)**:图注意力网络(GAT)是一种用于图数据的神经网络,它通过注意力机制来学习图中节点之间的重要性权重。EGAT可能是在GAT基础上进行了改进,可能是改进了注意力机制的计算方式,或者结合了额外的信息来更准确地捕捉节点之间的关系。例如在社交网络中,能够更精准地分析用户之间的社交关系强度。 - **EGAT - LSTM 结合**:将EGAT和LSTM结合起来,可以同时利用图结构信息和序列信息。EGAT可以处理图数据,学习节点之间的关系,而LSTM可以处理序列数据,捕捉时间上的依赖关系。例如在交通流量预测中,图可以表示道路网络中各个路口的连接关系,序列可以表示每个路口在不同时间的交通流量数据,通过EGAT - LSTM模型可以综合考虑路口之间的空间关系和流量的时间变化,从而更准确地预测交通流量。 ### 应用场景 - **交通领域**:在智能交通系统中,用于交通流量预测、交通事故预测等。如前面提到的,结合道路网络的图结构和交通流量的时间序列数据,提前预测交通拥堵情况,为交通管理部门提供决策支持。 - **金融领域**:用于股票价格预测、风险评估等。可以将不同金融产品之间的关联关系构建成图,同时考虑金融数据的时间序列特性,通过EGAT - LSTM模型更准确地预测股票价格走势和评估金融风险。 - **医疗领域**:在医疗健康监测中,用于疾病预测、患者健康状态评估等。例如将患者之间的相似性、医疗设备之间的连接关系构建成图,结合患者的生命体征等时间序列数据,预测患者可能出现的疾病或健康恶化情况。 ```python # 以下是一个简单的LSTM代码示例(使用PyTorch) import torch import torch.nn as nn class SimpleLSTM(nn.Module): def __init__(self, input_size, hidden_size, num_layers, output_size): super(SimpleLSTM, self).__init__() self.lstm = nn.LSTM(input_size, hidden_size, num_layers, batch_first=True) self.fc = nn.Linear(hidden_size, output_size) def forward(self, x): out, _ = self.lstm(x) out = self.fc(out[:, -1, :]) return out # 示例参数 input_size = 10 hidden_size = 20 num_layers = 2 output_size = 1 model = SimpleLSTM(input_size, hidden_size, num_layers, output_size) ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值