Learning to Compare: Relation Network for Few-Shot Learning论文笔记

在语音问答系统中,因每类训练数据量少,传统分类器易过拟合,故研究小样本学习。介绍了小样本学习基本概念,评价了一篇相关论文,阐述了 few - shot 算法通过对比图像特征识别,zero - shot 算法通过对比图像描述和图像识别,还给出了算法结构和目标函数。

前言

在语音问答系统领域,很多时候,每一个类所拥有的训练数据量是很少的,采用传统的分类器进行训练,很可能出现overfitting,为了应对这种问题,最近要研究一下小样本学习。
关于小样本学习的基本概念,可以参看https://www.chainnews.com/articles/650132977783.htm,该综述中还提到了每种类型算法中的典型算法。

论文评价

论文链接:https://arxiv.org/pdf/1711.06025.pdf
这篇论文结构简单,没有很多技巧,但是效果好,理论清晰,是一篇很赞的文章,很喜欢这类文章。

few-shot 算法

  • few-shot: 通过对比图像与图像之间的特征来实现识别;
  • zero-shot:通过对比对图像的描述和图像来实现识别;
  • 该论文框架也可适用于zero-shot, 本节主要针对few-shot讲解

该论文采用一个深度网络,该网络包含两个模块:embedding module和relation module。
embedding module 负责将support set中的图像和batch中的图像进行编码(其实就是提取各自的特征),relation module的任务是以这两个特征为输入,判断两个图像的匹配得分,1表示是同一个类,0表示为不同类。
算法整体结构:
在这里插入图片描述
上图中 f ψ f_{\psi} fψ代表embedding module, g ϕ g_{\phi} gϕ代表relation module, 训练时 C-way k-shot中, 每个类中的1张query image(如上图中穿最下方穿红衣服的狗狗)通过embedding module得到其feature,该类support set中的k个images 都通过embedding module 得到k个features,将该k个features的对应元素求和得到该类的feature,将该类的feature和query image的feature进行concatenate送到relation module,relation module得到一个得分,利用MSE作为目标函数,上述过程用公式表示如下:
r i , j = g ϕ ( C ( f ψ ( x i ) , f ψ ( x j ) ) ) r_{i,j}=g_{\phi}(C(f_{\psi}(x_i),f_{\psi}(x_j))) ri,j=gϕ(C(fψ(xi),fψ(xj)))
其中, C C C代表concatenation, r i , j r_{i,j} ri,j代表得分。
目标函数为:
a r g m i n ψ , ϕ ∑ i i = m ∑ j j = n ( r i , j − 1 ( y i = = y j ) ) argmin_{\psi,\phi}\sum_{i}^{i=m}\sum_{j}^{j=n}(r_{i,j}-1(y_i==y_j)) argminψ,ϕii=mjj=n(ri,j1(yi==yj))
其中, y j y_j yj代表query image的类别标签, y i y_i yi代表support set中第i类的标签。

具体的网络结构如下图所示:
在这里插入图片描述

zero-shot

在这里插入图片描述
DNN用作处理image的embedding module, 可采用imageNet上训练好的InCeption v2或者ResNet101,左侧输入语义向量。

### 回答1: "Learning to Compare: Relation Network for Few-Shot Learning" 是一篇关于Few-Shot Learning小样本学习)的论文,提出了一种称为“关系网络”的新型神经网络架构。 该网络旨在解决小样本学习中的问题,该问题通常会导致在只有极少量的训练样本的情况下,模型的泛化性能下降。关系网络使用一个子网络来提取图像特征,并通过计算这些特征之间的关系来对它们进行分类。 关系网络的特点是它在执行分类任务时能够捕捉物体之间的关系和上下文信息,因此在少量样本的情况下,它的性能比其他方法更好。该网络已经被广泛应用于小样本学习领域,并在多项实验中获得了优秀的表现。 ### 回答2: 本文主要介绍了一种基于关系网络的few-shot学习方法——Relation Network(RN)。Few-shot学习是一种类别识别的任务,旨在从非常少量(通常是几个)的样本中学习新的类别。RN为此提供了一种强大的框架,可以在few-shot学习中能够有效地捕捉物体之间的关系,从而实现精确的类别识别。 RN在模型设计中引入了两个重要的组件:特征提取器和关系网络。特征提取器通常是卷积神经网络(CNN),它可以提取出每个样本的特征表示。关系网络的作用是计算出每对样本之间的关系,将这些关系汇总到一起,最终出现样本之间的相对关系。在计算样本之间的关系时,RN采用的是一种全连接神经网络,它对每一对样本的特征进行融合,然后输出一个特定类别的置信度。 值得注意的是,RN的关系网络不仅可以使用在few-shot学习中,也可以应用于全局分类问题。此外,RN采用了一些有效的技巧来加速测试阶段的推理速度,比如使用浅层矩阵乘法以减少计算量,和简单的欧氏距离作为度量衡量。 总而言之,RN是一种强大的学习方法,特别是在few-shot学习方面,可以实现更好的判别性能和更准确的类别识别。不过,同时也存在一些限制,比如需要更多的数据集来训练样本的特征提取器,以及容易出现过拟合问题。因此,RN还需要进行更深入的研究和优化,以实现更大范围的应用和实际效果。 ### 回答3: 学习比较:关系网络是一种少样本学习的方法,旨在解决少样本学习问题中的挑战。传统的机器学习方法需要大量数据来训练模型。而在现在许多领域,例如医疗诊断和工业生产,只有很少的数据可用于训练模型。在这种情况下,少样本学习就变得非常重要。学习比较:关系网络是少样本学习的一种新方法,它通过学习对象之间的关系来捕捉它们之间的相似性和差异性。 学习比较:关系网络包含两个部分:特征提取器和关系网络。特征提取器将输入图像转换为对应的向量表示,而关系网络则对这些向量进行比较,从而推断它们之间的关系。关系网络可以用来处理各种不同的问题,例如分类、回归和生成等。 学习比较:关系网络的优点是,它可以利用少量的数据来学习,并且可以在不同的任务之间共享知识。这使它成为处理少样本学习问题时的一个有力工具。在实际应用中,学习比较:关系网络已经被广泛应用于图像分类、目标检测和语音识别等领域,并产生了许多显著的结果。未来,随着越来越多的研究者开始使用这种方法,我们可以期待看到更多的成功案例,并进一步将学习比较:关系网络应用到更广泛的领域,以帮助人们解决难题并改善生活质量。
评论 6
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

勤劳的凌菲

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值