实体抽取和远程监督

本文探讨了实体关系抽取的过程,强调了在训练模型时如何通过监督学习、无监督学习和自助学习来标注实体间的关系。远程监督作为一种有效的手段,也在文本挖掘中起到关键作用。模型学习了种子实例后,能应用于大规模语料库,自动识别实体对之间的关系。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1. 实体关系抽取

定义: 抽取一个句子中实体对之间的关系。
解决思路: 想要训练一个关系抽取器,给它一个句子俩实体,首先它需要知道给这俩实体间的关系打个什么标签,模型不可能自己给关系取名字,所以肯定需要人用标注好的语料告诉他,这俩实体间的关系叫啥。然后模型训练好了,再遇到哪个句子里有这种实体对,他就会知道是这个关系并抽出来。

监督学习、无监督学习、自助学习(从数据集中选取一批种子实例(seed instances),学习完这些种子实例之后应用到大规模语料库中)

2. 远程监督

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值