这篇论文可以说是阅读理解领域的奠基之作。
文中最主要的收获就是,提出的三种神经网络模型
1. Deep LSTM Reader
处理过程如图,这个图是用两层的lstm来encoder document ||| query对(这个符号|||表示链接),然后再用得到的表示做分类(得到的输出y,再输入到图右g函数,来做判断)。但是这个两层的lstm我暂时的理解是用了两个lstm。这里希望后续能找到源码看一下
![]()
![]()
圈出来的部分是我认为对这部分的介绍比较重要的部分,这里面我理解他说的是当我们将doc中的内容一个词一个词先输入到LSTM encoder中,然后在分割符(|||)后,把query也一个词一个词的输入到encoder中。这里作者也尝试了先将query输入encoder,然后再输入doc中的内容。结果却是模型把每个doc-query对,当做一个单一的长句子。而对于给定的embedding后的doc和query,模型需要预测doc中的哪个token(这个token,我的理解是lstm中的哪个中间输出状态)去回答query。模型数学知识支持: