文本蕴含识别与计算语义学
1. 引言
文本蕴含(Textual Entailment)长期以来在形式语义学中被用作说明工具,用于展示或说服学者某些自然语言推理是否成立。直到2005年,识别文本蕴含(Recognizing Textual Entailment,RTE)作为自然语言处理领域的一项共享任务被提出,尽管计算变体的想法早在之前就已出现。
RTE的挑战在于预测一段(短)文本是否蕴含另一段(短)文本。RTE数据集是文本 - 假设对的集合,并带有标准标签。例如:
| 示例 | 文本(T) | 假设(H) | 标签 |
| ---- | ---- | ---- | ---- |
| 示例1 | 我最近乘坐一辆14座的巴士从阿布贾前往阿达马瓦州首府约拉,然后再返回阿布贾。 | 阿布贾位于阿达马瓦州。 | FALSE |
| 示例2 | “丰饶号”在战争结束后抵达,于1945年8月21日驶入旧金山湾。“丰饶号”随后被分配到日本横须贺担任医院船,于1945年11月1日离开旧金山。 | “丰饶号”于1945年8月抵达旧金山。 | TRUE |
很快人们发现RTE是一项极其困难的任务,基于文本表面特征的简单基线系统很难被更复杂的系统超越。要解决这个问题,不仅需要对文本进行强大而准确的分析,还需要利用外部资源来辅助推理过程。
针对RTE提出了各种方法,从面向表面的技术到使用复杂语义分析的方法。本文重点关注基于逻辑推理来确定文本推理的方法,即把文本翻译成逻辑公式,然后使用经典逻辑推理来判断T是否蕴含H,T和H是否一致或矛盾等。但这个想法在实际执行中并不容易。
本文旨在探讨以下问题:
1. 能否使用深度语义
超级会员免费看
订阅专栏 解锁全文
947

被折叠的 条评论
为什么被折叠?



