摘要
在基于迁移的小样本学习中利用特征分布
过去,优秀的backbone和有效的后处理,使得基于transfer的方法达到了最强的性能。基于这一思路,本文提出了一种新的基于transfer的方法,在两点做了改进:
- 对特征向量预处理,使其接近高斯分布
- 利用一种optimal-transport 启发式算法,进行预处理
1.Intro
基于迁移结构(也叫backbone结构):通常训练的域与实际的域并不相同。所以,使用backbones提取的特征向量的分布非常复杂。因此,数据分布的强假设 会使得其方法不能很好的利用提取出的特征。所以,从两个方面解决了基于迁移的小样本学习问题。1,就是预处理特征使其拟合高斯。2,利用这个特定分布。(这个思想要归功于一个优秀的、基于最大后验和最优运输的算法)
2. 方法
2.1 问题定义:
Dbase | 包含大量的有标签样本,来自K个类 |
Dnovel | 也叫做task,包含少量的有标签样本(support set),以及一些无标签的样本(query set) 来自w个novel类。 |
注意support和query都属于Dnovel。
目标是预测query set中的无标签样本。
所以,w way,s shot。以及q个无标签的样本。
所以,Dnovel中总共有w(s+q)个样本。ws个有标签,wq个用来分类。
2.2 特征提取
首先,仅使用Dbase来训练神经网络的backbone。本文中,同时使用了两个backbone,即WRN+Resnet和Densenet。训练好的backbones(