目录
关系抽取之远程监督算法 - Luv_GEM - 博客园 (cnblogs.com)
前言
远程监督本质上是一种自动标注样本的方法。 远程监督方法缺少人工标注数据集, 因此, 远程监督方法比有监督多一步远程对齐知识库给无标签数据打标的过程,而构建关系抽取模型的部分, 与有监督领域的流水线方法差别不大。
本文总结关系抽取中的远程监督方法,解读三篇重要论文。第一篇是开山之作,第二篇解决了第一篇中的数据标注错误问题,第三篇解决了第二篇中的特征遗失问题。但是从最终的测试结果来看,论文的效果离落地实用还相差太远。
1. 远程监督关系抽取开山之作
论文:

本文总结了关系抽取中的远程监督方法,包括开山之作的远程监督模型、PCNN模型以及句子级别注意力机制。远程监督通过自动标注数据集解决监督学习的标注问题,但存在错误标注和特征丢失的问题。PCNN模型结合多实例学习缓解错误标注,分段最大池化增强特征,而句子级别注意力机制进一步提高信息利用率。
订阅专栏 解锁全文
6472

被折叠的 条评论
为什么被折叠?



