[论文笔记]ACL2021 Locate and Label: A Two-stage Identifier fo Nested Named Entity Recognition

本文介绍了一种解决嵌套实体识别问题的两阶段方法,结合边界回归和片段分类。第一阶段通过过滤器和回归器定位实体,第二阶段对边界打标签。模型利用IoU优化样本处理,并采用BiLSTM和span-level表示增强词表示。训练目标包括多个损失函数的加权和,最后通过Soft-NMS提取实体。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

2022/2/10 ACL2021 Locate and Label: A Two-stage Identifier fo Nested Named Entity Recognition
懒得粘图了,参考我的知乎https://zhuanlan.zhihu.com/p/466385935
1 摘要&介绍
当前的NER任务只能应对flat实体,不能应对嵌套(nested)实体。而能应对嵌套实体的模型,也有着高额计算指出、忽略边界信息、文段(span)利用率低的问题。
针对以上困难,文章提出了一个2阶段(two-stage)实体识别器:
①定位实体。具体来说,第一阶段由过滤器和回归器组成。过滤器将种子文段(seed spans)风格成文字文段和span proposal,然后过滤出候选文段(span candicate)。回归器通过调整span proposal的边界来提高候选文段的质量。
②给边界打标签。使用实体分类器给span proposal打标签。
论文的思路借鉴了对象发现(Object Detection)中关于嵌套实体的做法,至于两者为什么相同,见右图,并给出了几个原因:①两者都需要确定ROI(region of interest,感兴趣区域)的位置,并在对应区域上使用策略。
文章的创新点:
将NER看作一个边界回归和片段分类的联合任务。
充分李永乐边界信息来精确定位实体,甚至使用了span级的损失函数。
基于IoU弹性的处理样本数据,而不是简单的把部分匹配的span当做噪音样本。
2 Model
模型步骤
通过encoder得到词表示,然后生成种子sp

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值