Few-Shot Learning with Global Class Representations笔记整理

最新推荐文章于 2024-09-30 18:14:32 发布

原创

最新推荐文章于 2024-09-30 18:14:32 发布 · 1.1k 阅读

4 ·

CC 4.0 BY-SA版权

文章标签：

#人工智能 #机器学习 #计算机视觉

本文探讨了Few-Shot Learning问题，提出了结合全局类表征和样本合成模块的方法来解决类别不平衡，通过注册模块优化模型，增强模型在小样本数据上的表现。实验表明，这种方法能有效提升小样本学习的准确性。

Few-Shot Learning with Global Class Representations笔记整理

1 Introduction

在小样本学习（Few-Shot Learning, FSL）问题上，对于base classes中的每个类别，我们往往有充足的训练数据；对于那些novel classes中的每个类别，我们只有少量的带标签的数据。FSL旨在利用base calsses中大量的数据，来学习出一个可以对novel classes中的数据标签准确辨别的模型。

注：base class和novel class是本文作者自己创造的词汇，我没有想到很好的翻译方法。在文章里，base class指拥有充足样本的类别（用于训练）；novel class指的是那些只有少量样本的类（用于测试）。

现在解决小样本学习问题一般都使用元学习的方法，但是元学习的做法也有一定的局限性，因为它们往往只使用了源数据（source data），但是对于目标数据却几乎没有使用，即使在经历过fine-tuning阶段，也无法保证能学习到满足目标数据需求的模型。（比如，要辨别一个动物是不是猫，但现在手头上只有5张猫的照片以及大量狗，狮子，鸟的照片。这个时候元学习的一般做法是先在狗，狮子和鸟的照片上进行训练，训练好后再用5张猫的照片来进行微调。）

而作者在本文提出的方法同时使用5张猫（novel classes）的照片和大量狗，狮子，鸟（base classes）的照片来进行训练，作者把这称为全局表征（global class representations）。

因为将novel class在的少量数据和base class中的大量数据一起训练的话，势必会有样本不平衡的问题，作者使用两种方法来解决这一问题：

合成novel class的新样本；
引入片段训练（episodic training）。

2 Contributions

提出将base classes 和novel classes同时作为全局表征来进行小样本学习的训练；

3 Method

在这一节将首先介绍本方法的两个模块：表征注册模块和样本合成模块。然后再介绍如何将这两个模块合并起来，最后介绍如何将此方法拓展到生成式FSL的设定中（generalized FSL）。其中使用 $f_i = F(x_i)$ 表示一个样本 $x_i$ 经过特征抽取器F之后得到的视觉特征。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-e7Hi5kRU-1587442757514)(Few-Shot%20Learning%20with%20Global%20Class%20Representations%E7%AC%94%E8%AE%B0%E6%95%B4%E7%90%86.assets/image-20200420140026928.png)]

Overview of the whole framework.

3.1 样本合成模块

本模块用于解决类别不平衡问题，共分为两步：第一步用原始样本生成新的样本，第二步用第一步获取的所有样本合成一个新样本。

首先对novel classes在的原始样本使用random cropping, random fipping和data hallucination操作(这三个方法出自论文：Low-shot learning from imaginary data.)来为每个novel class生成 $k_t$ 个样本。

对于一个novel class $c_j$ ，作者先从中随机挑选出 $k_r$ 个样本，具体操作如下：
$\hat{k_r} \sim U(0,k_t),\\ k_r = \lceil \hat{k_r} \rceil$
其中， $U (a, b)$ 是平均分布。

对于一个novel class，再从 $\sim 1$ 平均分布中选出 $k_r$ 个值 ${ v_1,...,v_{k_r}\}$ ，将这

最低0.47元/天解锁文章

5 条评论

兔儿LQ 2020.05.02
我在网上搜了一下，好像也有几千小样本文章里提到了generalized fsl这种说法，不过也没有具体说明这个概念的来源。。。
- 兔儿LQ回复大雄0007 2020.05.28
  好的，谢谢您
- 大雄0007回复兔儿LQ 2020.05.28
  [reply]u011167608[/reply]zero-shot learning有这种说法，很多。

兔儿LQ 2020.05.02
您好，请问文章边提到的standard few-shot learning和generalized few-shot learning这两个概念，是出自其他论文吗？
- miguemath回复兔儿LQ 2020.05.02
  [reply]u011167608[/reply]standard few-shot learning就是我们通常意义上表示的小样本学习，即数据分成support set和query set。generalized few-shot learning这个概念应该是作者自创的，我没有在其他论文中找到。