关系抽取(二)远程监督方法总结

本文总结了关系抽取中的远程监督方法,包括开山之作的远程监督模型、PCNN模型以及句子级别注意力机制。远程监督通过自动标注数据集解决监督学习的标注问题,但存在错误标注和特征丢失的问题。PCNN模型结合多实例学习缓解错误标注,分段最大池化增强特征,而句子级别注意力机制进一步提高信息利用率。

目录

前言

1. 远程监督关系抽取开山之作

1.1 介绍

1.2 训练过程

1.2.1 数据标注方法

1.2.2 训练方法

1.3 测试过程

1.4 思考

1.5 总结

2. PCNN

2.1 介绍

2.2 模型结构

2.2.1 文本特征表示

2.2.2 卷积

2.2.3 分段最大池化

2.2.4 softmax多分类

2.3 多实例学习的过程

2.3 实验细节

2.3.1 数据集和评估方法

2.3.2 词嵌入和调参

2.3.3 模型评估结果

2.4 评价

3. 句子级别注意力

3.1 论文简介

3.2 模型介绍

3.3 实验细节

3.4 评价

4. 总结


关系抽取之远程监督算法 - Luv_GEM - 博客园 (cnblogs.com)

前言

        远程监督本质上是一种自动标注样本的方法。  远程监督方法缺少人工标注数据集, 因此, 远程监督方法比有监督多一步远程对齐知识库给无标签数据打标的过程,而构建关系抽取模型的部分, 与有监督领域的流水线方法差别不大。

        本文总结关系抽取中的远程监督方法,解读三篇重要论文。第一篇是开山之作,第二篇解决了第一篇中的数据标注错误问题,第三篇解决了第二篇中的特征遗失问题。但是从最终的测试结果来看,论文的效果离落地实用还相差太远。

1. 远程监督关系抽取开山之作

论文:

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

满腹的小不甘

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值