基于抽象意义表示的机器阅读理解技术
1. 引言
在自然语言处理领域,机器阅读理解(MRC)是一个重要的研究方向。传统的深度学习(DL)方法在MRC任务中取得了显著进展,但也存在一些局限性。本文将介绍一种基于抽象意义表示(AMR)的MRC技术,该技术可以系统地改进基于DL的端到端方法。
2. 纠正DL答案
2.1 答案替换与泛化
首先,将问题中的Wh表达式用识别出的答案进行替换。例如,问题 “What happened with Beyonce after 1990?” 替换后为 “Their hiatus saw the release of Beyonce’s debut album, Dangerously in Love” < + “with Beyonce after 1990” + >。然后,将替换后的问题与上下文中的每个句子进行泛化。如果泛化结果中不保留问题中的关键部分,如 “after 1990”,则表明该答案是错误的。
2.2 正确答案的识别
当AMRG检测到答案错误时,会搜索具有最大泛化(子图节点数量最多)的句子或短语。具体步骤如下:
1. 形成句法模板:将问题转换为陈述模板,例如 “What time is it?” 转换为 {Time - NN is - VBZ * - CD, Time - NN is - VBZ * - NER = date_time}。
2. 泛化模板:将模板与每个句子和动词短语进行泛化,找到具有最大子图的那个。例如,对于模板 [* - VP Beyonce - “NE = PERSON” after - IN 1990s - {NN
超级会员免费看
订阅专栏 解锁全文
9万+

被折叠的 条评论
为什么被折叠?



