Relation Extraction: Perspective from Convolutional Neural Networks(2015)论文阅读笔记

这篇博客探讨了在关系抽取(RE)任务中使用卷积神经网络(CNN)的首次尝试,针对RE任务中不平衡数据集的挑战。文章介绍了word representation、卷积、池化、正则化和分类等步骤,以及模型的超参数设置和实验结果。实验表明,多窗口CNN和结合word2vec的nonstatic.word2vec模型表现最优。此外,分析了不平衡数据集对模型性能的影响,揭示了RE任务相对于关系分类任务的复杂性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、背景:

相较于关系分类(Relation Classification,RC),关系抽取(Relation Extraction,RE)任务往往伴随着一个极不平衡的数据集,其中非关系的实例数远远超过其它实例数,这使得RE任务比RC任务更具挑战性,但也更加实用。

CNN已经在关系分类任务中取得了很大成果。但是目前为止,还没有工作将CNN运用到RE任务中去,本文是填补这一空白的第一次尝试,为今后在这一领域的研究提供了baseline。

二、模型:
在这里插入图片描述

1.Word Representation

首先,由于CNN只能处理定长输入,故使用trimming/padding策略,使每个句子长度一致。

word embedding:

对于每个单词xi,将其通过word embedding矩阵W映射为向量ei,维度为me

矩阵W使用随机初始化或预训练初始化。

position embedding:

对于每个单词xi,其到两个实体xi1,xi2的相对距离为i-i1,i-i2,将两个距离通过position embedding矩阵D映射为两个向量di1di2

由于相对距离的区间为[-n

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值