元学习论文OPTIMIZATION AS A MODEL FOR FEW-SHOT LEARNING的简单理解

最新推荐文章于 2025-05-17 12:00:00 发布

原创最新推荐文章于 2025-05-17 12:00:00 发布 · 2.4k 阅读

8 ·

CC 4.0 BY-SA版权

文章标签：

#元学习 #meta-learning

meta-learning 专栏收录该内容

2 篇文章

订阅专栏

本文探讨了元学习在小样本数据集上的应用，特别是在深度学习模型优化方面的挑战。介绍了基于LSTM的元学习模型如何模仿人类学习方式，通过少量数据快速掌握新任务，以及该模型如何更新分类器参数以提高学习效率。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

我们常用的基于梯度优化的深层网络往往需要大量的数据和迭代步骤。
我们面对的数据场景是有一系列小的数据集而不是一个大的数据集，每一个类有很少的标记数据，这种情况和人类的学习很像，通过一个给定的数据，就能总结出对事物全面的认识，其中主要有两个原因导致了基于梯度的优化算法在小样本下表现不好。元学习被认为是实现人类水平的智能的一个关键点，元学习在两个层次间学习，（1）在每项任务中学习，（2）同时积累任务之间相似性和差异的知识。
受参数梯度更新的启发，提出了基于lstm的元学习模型，因为元学习的更新和lstm细胞状态的更新相似，因此我们训练一个基于lstm的元学习器来学习训练网络过程中的更新规则，我们把lstm中单元的状态看作元分类器的参数，将元学习器的更新规则和LSTM的细胞状态更新相匹配。

元学习优化器能够在给定一系列分类器在训练集的梯度和损失下，为分类器生成一系列更新，从而使分类器达到较好的表现。每一步迭代t，基于lstm的元学习器都接受到分类器传来的梯度，损失等信息，元学习器基于此计算学习率和忘记门的值，并返回给分类器要更新的参数的值，每迭代T步，分类器的损失在测试集上计算出来返回给元学习器，用来训练元学习器，更新元学习器的参数。