关系抽取的论文粗读1
原文:www.emnlp2015.org/proceedings/EMNLP/pdf/EMNLP203.pdf
代码链接
https://github.com/ShomyLiu/pytorch-pcnn
https://github.com/pencoa/PCNN
what
背景:关系抽取是一类经典的 NLP 任务,也是构建高质量知识图谱的基础,针对关系抽取的研究工作非常多,远程监督是研究中的热点方法。
在这篇论文之前,主要有两类关系分类的思路:
1. 基于特征的方法,这种方式对人工特征向量的要求较高,需要为数据集找出一种合适的特征表示。
2. 基于kernel的方法,这种方式可以对输入进行丰富的表示,例如句法树。它能够通过核函数来提特征,当然也有很多核函数被提出,例如:convolution tree kernel,subsequence kernel,dependency tree kernel
how
- 提出使用PCNN来自动提取特征。
- 往PCNN中加入multi-instance learning,用来解决远程监督引发的错误标签问题。
- 提出分段进行max pooling,从而考虑两个Entity之间的结构特征。

四个部分:
Vector representation、Convolution、Piecewise max pooling、Softmax classifier.,参见网络结构图。
感谢与主要参考:
关系抽取阅读小组
远程监督关系抽取-论文解读https://zhuanlan.zhihu.com/p/39885744
Distant Supervision for Relation Extraction via Piecewise Convolutional Neural Networks
https://blog.youkuaiyun.com/dalangzhonghangxing/article/details/80298755
本文探讨了关系抽取在构建知识图谱中的关键作用,介绍了远程监督这一热点方法,并详细解析了通过使用PCNN结合多实例学习解决远程监督下错误标签问题的创新方案。
1770

被折叠的 条评论
为什么被折叠?



