Lecture 9 Textual Question Answering

最新推荐文章于 2024-04-28 23:57:50 发布

原创最新推荐文章于 2024-04-28 23:57:50 发布 · 455 阅读

1 ·

CC 4.0 BY-SA版权

NLP 同时被 2 个专栏收录

64 篇文章

订阅专栏

CS224n

9 篇文章

订阅专栏

随着各种技术的发展，我们可以轻易的收集到大量的文本数据，如何从中提取到有用的信息成为一个重要的问题。例如在网页搜索中，用户在搜索框中输入问题，搜索引擎将返回与之相关的多个网页，这种方式虽然能满足一定的需求，但仍需用户投入大量的精力寻找想要的答案。一种更为好的方法是系统可以根据用户的问题直接返回答案，这种形式在移动端和智能助手上显得更为的有用。

我们可以将上述的问题归结为两阶段进行：

根据问题寻找可能包含答案的文档：这一步使用常规的信息检索方法即可实现
在上一步得到的相关文档或是段落中找到正确的答案：这一步通常可以归到阅读理解这个子方向上

阅读理解的发展历史

在《Towards the Machine Comprehension of Text:An Essay》中给出了关于机器阅读理解的定义：

A machine comprehends a passage of text if, for any question regarding that text that can be answered correctly by a majority of native speakers, that machine can provide a string which those speakers would agree both answers that question, and does not contain information irrelevant to that question.

简单来说，阅读理解解决的问题为：将问题 $Q$ 和文档 $P$ 输入到模型中希望得到答案 $A$ 。