一、背景:
相较于关系分类(Relation Classification,RC),关系抽取(Relation Extraction,RE)任务往往伴随着一个极不平衡的数据集,其中非关系的实例数远远超过其它实例数,这使得RE任务比RC任务更具挑战性,但也更加实用。
CNN已经在关系分类任务中取得了很大成果。但是目前为止,还没有工作将CNN运用到RE任务中去,本文是填补这一空白的第一次尝试,为今后在这一领域的研究提供了baseline。
二、模型:

1.Word Representation
首先,由于CNN只能处理定长输入,故使用trimming/padding策略,使每个句子长度一致。
word embedding:
对于每个单词xi,将其通过word embedding矩阵W映射为向量ei,维度为me。
矩阵W使用随机初始化或预训练初始化。
position embedding:
对于每个单词xi,其到两个实体xi1,xi2的相对距离为i-i1,i-i2,将两个距离通过position embedding矩阵D映射为两个向量di1和di2。
由于相对距离的区间为[-n

这篇博客探讨了在关系抽取(RE)任务中使用卷积神经网络(CNN)的首次尝试,针对RE任务中不平衡数据集的挑战。文章介绍了word representation、卷积、池化、正则化和分类等步骤,以及模型的超参数设置和实验结果。实验表明,多窗口CNN和结合word2vec的nonstatic.word2vec模型表现最优。此外,分析了不平衡数据集对模型性能的影响,揭示了RE任务相对于关系分类任务的复杂性。
最低0.47元/天 解锁文章
561

被折叠的 条评论
为什么被折叠?



