【一起读ACL论文】Attention-over-Attention Neural Networks for Reading Comprehension

完形填空模型解析

最新推荐文章于 2021-11-03 14:40:21 发布

原创最新推荐文章于 2021-11-03 14:40:21 发布 · 706 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#自然语言处理 #acl #深度学习 #人工智能-神经网络

————自然语言处理———— 同时被 2 个专栏收录

8 篇文章

订阅专栏

IE QA Text Mining Applications

2 篇文章

订阅专栏

本文介绍了一种针对完形填空式阅读理解的模型，该模型通过双向考虑文档和提问的关系来提升理解准确率。它使用GRU进行文档和提问的embedding，并计算Pair-wise Matching Score来衡量二者间词语的相关度。进一步通过计算attention值来确定文档中词语的重要性。

一种针对完形填空式阅读理解的模型。综合来看，大概是双向考虑了文档->提问和提问->文档的关系。思想和实现都是非常简单的，从实验结果来看效果不错。而且也容易扩展到其他模型上。

这里写图片描述

整个模型如上图所示。大概分为三个部分：

和传统模型类似，先把Document和Query都embedding出来（用的是GRU）。

根据向量表示计算出一个矩阵表示，记为Pair-wise Matching Score. 表示查询的词语和文档词语之间的相关度。

$M(i,j) = h_{doc}(i)^T * h_{query}(j)$
计算出两个attention值出来，大概就是分别对矩阵的每一列和每一行做softmax。分别计算出query-to-document attention 和 document-to-query attention。

$\alpha(t)= softmax(M(1, t), .. , M(n, t))$

$\beta(t) = softmax(M(t ,1),..,M(t,m))$

在对每一行softmax之后，还需要对每一列得到的值取一个平均值。由此得到query-level attention。

$\beta = {1\over n} \sum^n_{t=1}\beta(t)$

用每个 query-to-document attention 和刚刚得到的 query-level attention 做点乘，得到 document 中每个词的 score。

$s = \alpha^T* \beta$
最后合并相同的词语。并计算出每个词语的score

$P(w|D,Q) = \sum s_i$

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。