本次介绍的一篇论文是2019年发布在CVPR上的一篇:
Revisiting Local Descriptor based Image-to-Class Measure for Few-shot Learning
这篇文章也是基于度量学习做的小样本,先简单回顾一下之前的一些模型。
对于衡量两个特征表示间的距离,匹配网络使用了余弦相似性公式,原型网络使用了欧几里得距离,关系网络使用一个网络来学习,当然,大部分的小样本学习工作使用的距离都是欧几里得距离。不过,他们度量的两个特征表示是全局性的,而这次介绍的论文度量的是局部性的特征描述。可以看图来理解全局性特征描述和局部性特征描述:
我们将一张3×84×84的图片,经过提特征之后得到64×21×21的特征表示,64代表通道数,那么这种情况下就有两种方式来理解这个特征。
第一种全局性特征,我们可以将64×21×21的特征表示分成64个21×21(也可以展开成441长度的一维向量)的特征表示,这样就有64个不同卷积核得到的64个不同的特征,但是这些特征都是通过整张图片的信息得到的,即可以理解为包含了整张图片的信息,所以可以称为全局性特征描述。
第二种局部性特征,我们可以将64×21×21的特征表示分成441个64长度的一维特征表示,每个64长度的一维向量中的数都是从图片中同一片区域卷积计算得到的,它