Few-Shot Image Recognition by Predicting Parameters from Activations

最新推荐文章于 2025-10-20 20:36:26 发布

原创

最新推荐文章于 2025-10-20 20:36:26 发布 · 1.9k 阅读

7 ·

CC 4.0 BY-SA版权

本文探讨了一种方法，通过训练参数预测器从神经网络激活值预测全连接层参数，以适应少样本图像识别任务。研究发现激活值和参数在空间分布上有相似性，模型能在大量和少量样本中保持良好性能。实验在ImageNet和MiniImageNet上展示了该方法的有效性。

在这里插入图片描述

本文基于神经网络中同一类别倒数层的激活值和最后的全连接softmax层的参数有密切的关系，通过训练一个参数预测器，使得在大量数据集中预训练过的网络可以通过直接从激活值预测参数的方式将模型映射到只有少量样本的测试数据集中。作者希望模型可以在少样本和大量样本的情况下均有良好的表现。

Alt text

作者通过使用t-SNE对激活值的期望 $aˉy\bar{a}_y$ (左)和全连接层的参数 $w_y$ (右)进行了可视化，同一颜色和形状的点表示同一种类别，形状相同的属于同一大类，可以发现同一类别的激活值在空间分布上是聚集在一起的。在最后的全连接层中，对应类别的 $wy⋅ay\ w_y\cdot a_y$ , $ay∈Ayfor\ all\ a_y \in A_y$ , $a(x)∣x∈Dlarge∪Dfew,Y(x)=y}A_y = \{a(x) | x\in D_{large} \cup D_{few}, Y(x) = y\}$ （a(x)表示样本x的激活值）越大，分类的效果越好。所以 $w_y$ 的分布应该与 $aˉy\bar{a}_y$ 的分布越接近越好，以便使內积最大。这个结果说明在一个好的特征提取的情况下是存在一个类别无关的从激活值到参数的映射，也就是要训练的参数预测器 $ϕ\phi$

模型

模型在大量的数据集中进行训练，由于激活值和参数在各自的空间中具有相似相似的局部和全局结构，所以在 $C_{few}$ 的类别上应该有比较好的泛化能力。

1. 预测器

通过在大量数据集上最小化分类损失学习预测器 $ϕ\phi$
$\mathcal{L} = \sum_{(y,x)\in D_{large}}[-\phi(\bar{a}_y)a(x)+log{\sum_{y\prime\in C_{large}}e^{\phi(\bar{a}_{y\prime})a(x)}}]+\lambda||\phi||$

最低0.47元/天解锁文章