基于Bert的实体关系抽取模型

最新推荐文章于 2025-03-31 23:28:50 发布

NLP分享汇

最新推荐文章于 2025-03-31 23:28:50 发布

阅读量5.9k

点赞数 19

分类专栏：关系抽取文章标签：自然语言处理深度学习

本文链接：https://blog.youkuaiyun.com/u014577702/article/details/116606649

版权

关注微信公众号：NLP分享汇。【喜欢的扫波关注，每天都在更新自己之前的积累】

文章链接：https://mp.weixin.qq.com/s/OebxnvwjQiVbBZZFL2Un3A

前言

信息抽取(Information Extraction, IE)是从自然语言文本中抽取实体、属性、关系及事件等事实类信息的文本处理技术，是信息检索、智能问答、智能对话等人工智能应用的重要基础，一直受到业界的广泛关注。信息抽取任务涉及命名实体识别、指代消解、关系分类等复杂技术，极具挑战性。而本文旨在介绍如何利用Bert预训练模型进行关系抽取任务。

相关链接

GitHub：https://github.com/yuanxiaosc/Entity-Relation-Extraction

竞赛官网：http://lic2019.ccf.org.cn/

理解难度：★★★★★

解决思路

1、先使用bert搭建的关系分类模型，简单来看就是一个多标签分类任务，类别就是下述的那几种关系；

2、接着用预测出来的关系和文本，使用bert搭建一个实体抽取的模型，其简单来看也是一个分类模型，类别是：

["[Padding]", "[category]", "[##WordPiece]", "[CLS]", "[SEP]", "B-SUB", "I-SUB", "B-OBJ", "I-OBJ", "O"]

【 SUB对应的就是subject，B-SUB就是第一个实体开始的位置，后续的是I-SUB，OBJ就是第二个实体】

关系类型如下：

['丈夫', '上映时间', '专业代码', '主持人', '主演', '主角', '人口数量', '作曲', '作者', '作词', '修业年限', '出品公司', '出版社', '出生地', '出生日期', '创始人', '制片人', '占地面积', '号', '嘉宾', '国籍', '妻子', '字', '官方语言', '导演', '总部地点', '成立日期', '所在城市', '所属专辑', '改编自', '朝代', '歌手', '母亲', '毕业院校', '民族', '气候',

最低0.47元/天解锁文章