原文链接:
https://aclanthology.org/2022.findings-acl.124.pdf
ACL 2022
介绍
问题
目前基于span的跨度量学习(metric learning)的方法存在一些问题:
1)由于是通过枚举来生成span,因此在解码的时候需要额外处理重叠的span;
2)non-entites类别的原型通常都是噪声;
3)跨域时,最有用的信息就是当前领域有限的样本,之前的方法只将这些样本用于分类的相似性计算。
IDEA
作者提出分解元学习(decomposed meta-learning)的方法来解决Few-shot ner任务(实体的边界检测和实体的分类)。
将span检测作为序列标注问题,并通过引入MAML(model-agnostic metalearning 不是很懂 可以参考这篇文章Model-Agnostic Meta-Learning (MAML)模型介绍及算法详解 - 知乎)训练span detector,从而找到一个能快速适应新实体类别的模型参数进行初始化;对于实体分类,作者提出MAML-ProtoNet来找到一个合适的向量空间对不同类别的span进行分类。
方法
整个方法的整体结构如下所示:

Entity span Detection
&nbs

研究者提出了一种基于分解元学习的方法,解决了基于span的实体检测和分类问题,通过MAML训练spandetector,以及MAML-ProtoNet进行跨域实体类型识别。实验表明该方法在Intra和Inter数据设置以及Cross-Dataset上表现优秀。
最低0.47元/天 解锁文章
2746

被折叠的 条评论
为什么被折叠?



