SpanProto: A Two-stage Span-based Prototypical Network forFew-shot Named Entity Recognition

文章介绍了一种新的方法SpanProto,针对Few-shotner问题,通过span-based的两阶段学习,关注实体边界信息,并使用边际损失减少假阳性的错误。研究者提出原型学习和基于边界的分类策略,以提高在少量标注数据下的实体识别性能。

原文链接:

https://aclanthology.org/2022.emnlp-main.227.pdf

EMNLP 2022

介绍

        问题

        Few-shot ner之前的方法都是基于对token进行分类,忽略了实体边界的信息,同时大量的负样本(non-entity)也会影响模型的性能。

        IDEA 

         作者提出了一个span-based的two-stage原型网络(SpanProto)来解决Few-shot ner问题;在span提取阶段,将序列tag转化为一个全局的边界矩阵,使得模型能够注意到准确的边界信息。在分类阶段,对每个实体类别计算原型(prototype)embedding,并利用原型学习在语义空间中调整span的表征。另外,为了解决false positive问题,作者设计了一种margin-based损失,来增大false positive和所有原型之间的语义距离。

方法

        模型的整体结构如下所示:

         一个训练步的数据\varepsilon _{train}=(S_{train},Q_{train},T_{train}) \in D_{train},分别表示support set、query set和实体类型集合。对于每个样本\left ( X,M,y \right )\in S_{train}\cup Q_{train}

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值