Chinese NER Using Lattice LSTM论文笔记

本文介绍了命名实体识别(NER)的重要性,并对比了基于字符和基于词的两种中文NER方法。重点阐述了LatticeLSTM模型,它结合了字和词的语义信息,解决了中文NER的边界问题,且在多个数据集上达到最优效果。LatticeLSTM通过词典增强,改善了基于字方法的不足,但增加了计算复杂性,并仍存在信息利用不完全的问题。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

如何帮助理解本文

了解Basic LSTM的基本原理,最好能进行公式的推导

什么是命名实体识别?

命名实体识别(Named Entity Recognition,NER)是NLP中一项非常基础的任务。NER是信息提取、问答系统、句法分析、机器翻译等众多NLP任务的重要基础工具。命名实体识别的准确度,决定了下游任务的效果,是NLP中非常重要的一个基础问题。举个例子:
在这里插入图片描述
命名实体识别的任务就是从文本中自动提取出各种类型的命名实体,如上图的人名实体、机构实体、地点实体等。
**

中文命名实体识别的两种方案

**
1.基于中文字的方法
即以每一个中文字为一个单位进行标注和训练,不需要对文本进行分词,但是基于字符的方案存在无法利用词与词之间的语义信息,影响了命名实体识别的效果。
在这里插入图片描述
如上图所示,首先将字符通过Embedding生成对应的向量,即x,然后通过特征提取网络如双向LSTM模型生成c,在通过CRF进行解码输出最后的结果。

2.基于中文词的方法
即以中文词为一个单位进行标注和训练,需要首先对文本进行分词,再形成对应的词向量,这种方法考虑了词

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值