前言
cs224n 第15讲,讲解了指代消解的概念、传统算法、神经网络算法等相关内容。
文章目录
什么是指代消解
简单来说就是代指的问题,在语言中总是会用代词、名词或者一些名词性短语来代替其他事物,比如下图中的his和he都是代指Obama
在课上,Manning对着一篇短文讲解了很久,总体意思就是文章中有很多代指的代词或者名词性短语,同时在判定代指对象时有很多复杂的问题,不容易判断。比如说短文中所有的she、her都是在代指Vanaja,但是短文开头同时出现了两个人名;the best tree并没有代指任何事物,只是简单的描述。
另外,在常见文本中还会存在着大量嵌套的情况,比如下图中的Prime Corp被提及,同时CFO of Prime Corp也被提及的情况。
指代消解的应用
- 全文理解
- 机器翻译:比如有的语言不区分男他和女她,在翻译时需要指代消解
- 文本摘要:使用代词会使行文更加自然
- 信息提取和QA系统
指代消解的评测
结合聚类的思想,发现指代消解和聚类很像,所以聚类的评测方法都被尝试过用于指代消解的评测。这里关注的是其中一种方法–B cubed。
图中的准确率P和召回率R是针对于蓝色这一类计算的。
指代的类型
NLP解决的更多的是后两种类型的指代问题。
还提到一种,就是说并不是所有的NP都在指代。下图中绿色的NP代指全集或者空集,没有具体指代。