基于依赖图的图卷积神经网络提取药物相互作用
Extracting Drug-drug Interactions with a Dependency-based Graph Convolution Neural Network
2019.11 2019 IEEE International Conference on Bioinformatics and Biomedicine (BIBM)
目录
1.摘要
药物相互作用(DDI)在药物警戒等生物医学的各种应用中发挥着关键作用。生物医学出版物中经常报道DDI,使其成为提取DDI的有效来源。尽管神经网络在DDI提取方面取得了竞争优势,但之前的工作依赖依赖路径来去除生物医学出版物句子中的噪声。然而,这种方法可能会忽略关于DDI的关键信息。有效地利用大量依赖信息可以改进DDI提取。在这篇文章中,我们提出了一个模型,该模型结合了图卷积神经网络(GCN)和双向长短记忆(BiLSTM),从句子的整个依赖图中提取DDI交互。我们在该领域的基准语料库中评估了我们的模型,即DDIExtraction 2013语料库。我们的模型获得了最先进的结果(F1的77.0%),这优于之前工作中报告的结果。
结合了图卷积神经网络(GCN)和双向长短记忆(BiLSTM),从句子的整个依赖图中提取DDI交互。
2.INTRODUCTION
生物医学文献中包含了大量关于DDI的最新信息。生物医学文献的快速增长使得手动DDI提取变得不可能。因此,开发从生物医学文献中自动提取DDI的系统对于正在进行的临床研究具有重要意义。
-
机器学习方法:传统的基于特征的方法。
-
基于神经网络的方法优于传统的基于特征的方法[6],[7]。然而,神经网络无法有效地从长而复杂的句子中学习。例如,DDIExtraction 2013语料库中最长的句子包含150多个单词。因此,神经网络很难捕获有用的信息,同时忽略长句子中的噪声。
-
一些研究将最短依赖路径(SDP)[8]、[9]纳入深度神经网络,这可以提高性能,因为SDP能够去除噪声,但在句子中保留有效信息。最近的研究[10]证明了这种方法在DDI提取中的有效性。然而,依赖路径可能会从句子中丢失某些关键信息。
将整个依赖图集成到深度神经网络中:
-
双向长短记忆(BiLSTM)被用于学习每个单词的表示,并将其应用于整个句子。
-
将句子的整个依赖图送入图卷积神经网络(GCN)[11]、[12],以将依赖信息集成到单词表示中。
-
使用最大池层从单词表示中捕获显著信息,并生成句子和两个目标药物实体的表示。
-
这些表示被连接并馈送到多层感知器(MLP)[13]中,用于softmax分类。(DDI提取任务被视为分类任务)
我们提出的模型在DDI提取的基准语料库上进行了评估,即DDIExtraction 2013语料库。实验结果表明,我们的模型取得了最先进的结果。
relate
传统的机器学习方法:其中大多数需要提取各种词汇和句法特征,并将其提供给分类器,如SVM或随机森林[6]、[7]、[15]、[16]。已经提出了另一种基于核的方法[16]-[18],并成功地用于DDI提取。通常,这些基于内核和基于特征的方法高度依赖于内核函数或特征集的精心设计。
深度学习:如CNN(卷积神经网络)和RNN(递归神经网络)[19],[20]。一些研究人员将CNN与用于DDI提取的其他信息相结合,如句法信息[21]、分子信息[22]。RNN比CNN更有效,并与注意力机制[23]、基于特征的分类器[24]或SDP[10]结合用于DDI提取。一些研究人员[2

该博客介绍了如何利用图卷积神经网络(GCN)和双向长短记忆(BiLSTM)结合,从生物医学文献的依赖图中有效提取药物相互作用(DDI)。研究指出,依赖路径可能丢失关键信息,而整个依赖图的使用能提高DDI提取性能。模型在DDIExtraction 2013语料库中达到最先进的结果,F1得分77.0%,优于传统方法。
最低0.47元/天 解锁文章
5903

被折叠的 条评论
为什么被折叠?



