论文笔记：Hybrid Attention-Based Prototypical Networks for Noisy Few-Shot Relation Classification

最新推荐文章于 2024-06-02 09:48:52 发布

原创最新推荐文章于 2024-06-02 09:48:52 发布 · 1.8k 阅读

CC 4.0 BY-SA版权

文章标签：

7 篇文章

订阅专栏

针对小样本关系抽取问题，介绍一种改进的原型网络方法。通过引入混合注意力机制，增强模型对噪声数据的鲁棒性及特征区分能力。在FewRel1.0数据集上，即使存在错误标注，仍能有效提升模型性能。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

问题设定：小样本关系抽取，N way K shot 的任务。
数据集：FewRel 1.0数据集，在数据集中引入了（错误标注的情况）
出发点：在小样本中噪声数据对模型影响是巨大的。小样本学到的特征是稀疏的。
方式：小样本学习中的metric learning方法，用了之前Prototypical网络，作了一定改进。将简单的avg换成了attention。引入了基于实例、基于特征的混合注意力。缓解出发点提到的两个问题。
做法：对每个query，都是拿整个support set与其计算相似度，最终是一个N维的相似度量，取最大作为其类别。

在这里插入图片描述
输入: $Support，x_{query}）$
输出： $x_{query}$ 对应的类别。

本文对于这个网络的改进，就是第三个模块。

Instance-level Attention

Feature-level Attention

出发点：先前研究论证了距离函数的选择会影响这个网络的能力。小样本数据集意味着特征是稀疏的，简单的欧式距离能力不足。虽然特征空间是稀疏的，但总会有些维度有更强的区分能力，所以需要特征层面的注意力机制。
修改距离计算：
这里的关系 $i$ 的注意力得分就不是一个标量了，而是一个得分向量 $z_i$ 。
就是将该关系下的K个实例的编码向量 $x_1,x_2,...x_K)$ 进行多次卷积得到的。

具体操作就是这张图。