论文笔记:EGAT: Edge Aggregated Graph Attention Networks and Transfer Learning

本文提出了一种名为EGAT(EdgeAggregatedGraphAttentionNetworks)的新方法,用于精确预测蛋白质相互作用位点。EGAT通过引入边聚合图注意力层,有效利用蛋白质结构信息,提高了预测准确性。方法结合了ProtBERT的预训练特征,实现了迁移学习,同时提供了可解释性。实验结果显示,EGAT在各种条件下均优于其他先进技术,并且揭示了长期相互作用对预测的影响。

论文概况

原文链接:https://www.biorxiv.org/content/10.1101/2020.11.07.372466v2.abstract
原文代码链接: https://github.com/Sazan-Mahbub/EGAT

摘要

边缘聚集图注意网络(EGAT:Edge Aggregated Graph Attention Networks)一种高精度的基于深度学习蛋白质相互作用位点的预测方法,引入了一个新的边缘聚合图注意网络来有效地利用结构信息。首次将迁移学习应用于PPI站点预测。提出的边缘聚合网络,以及迁移学习,已经取得了显著的改进比最佳替代方法。此外EGAT提供了一个比典型的黑盒深度神经网络更易于解释的框架。

1 介绍

氨基酸残基相互作用的定义:绝对溶剂可及性小于1 A ˚ 2 Å^2 A˚2
Graph neural networks (GNN)编码结构特征:已经应用于成对结合位点的预测,但是还没有应用于单个的氨基酸残基。
Graph Attention Network (GAT)编码结构特征:采用了注意力机制,但是仅仅只考虑了节点,没有考虑边的特征,GAT缺乏利用边缘特征中可能编码的丰富结构信息的能力。
边缘聚集图注意网络(EGAT:Edge Aggregated Graph Attention Networks):有效利用编码在边缘特征中的结构信息。在预训练的模型中成功用迁移学习,EGAT还有助于构建可解释的深度学习模型。

2 方法

2.1 特征表示

2.1.1 蛋白质的图表示

EGAT模型是一个基于图神经网络的体系结构,将数据集中每个蛋白质P的三维结构表示为有向k近邻图G。

  1. V (G) :表示氨基酸残基节点
  2. N i N_i Ni:表示节点i的领域,i一共有K个领域节点,如下图K=3。任何两个节点(残基)之间的距离是通过它们的平均原子之间的距离来计算的(使用PDB文件中的原子坐标。
    在这里插入图片描述
图一、局部特征提取器
### 2.1.2 节点特征表示

输入的序列 X = X 1 , X 2 , . . . . X N {X=X_1,X_2,....X_N} X=X1,X2,....XN通过ProtBERT进行编码产生节点特征向量{ q = q 1 , q 2 . . . q N q=q_1,q_2...q_N q=q1,q2...qN}, q i ∈ d p r o t b e r t q_i∈d_{protbert} qidprotbert d p r o t b e r t d_{protbert} dprotbert=1024),与其他方法相比,ProtBERT在残基水平分类任务上取得了更好的性能,EGAT与ProtTrans中提供的预训练语言模型无关,这

评论 1
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值