零样本学习(Zero-shot learning)以及它与少样本学习(Few-shot learning)、单样本学习(One-shot learning)、监督学习(Supervised learn

零样本学习(Zero-shot learning)以及它与少样本学习(Few-shot learning)、单样本学习(One-shot learning)、监督学习(Supervised learning)的区别


1. 零样本学习(Zero-shot Learning)

定义: 零样本学习指的是在训练过程中模型从未见过目标类别的样本,但在推理时依然能够对这些类别进行正确预测。模型借助于辅助的语义信息(如属性描述、文本描述、类别嵌入等)来建立已知类别与未知类别之间的关联,从而实现对新类别的泛化能力。

典型方法:

  • 语义嵌入映射: 模型在训练时学习如何将视觉特征映射到一个语义空间(例如,使用词向量或者属性描述构成的空间),在推理时,通过计算输入样本与各类别语义表示的相似度,实现对未见类别的识别。

  • 生成模型方法: 有时会利用生成对抗网络(GAN)或变分自编码器(VAE)等方法生成虚拟样本,增强对未见类别的判别能力。

应用场景: 零样本学习常用于现实场景中,当存在大量类别但标注数据有限的情况下(例如,新出现的物体类别、稀有疾病诊断等)。


2. 少样本学习(Few-shot Learning)

定义: 少样本学习是指每个目标类别仅有少量标注样本(例如 5 个或更少),模型需要利用这些有限的样本进行快速学习和泛化。它要求模型具备较好的先验知识或者通过元学习(meta-learning)的方法进行快速适应。

典型方法:

  • 原型网络(Prototypical Networks): 通过计算样本特征与每个类别的原型(平均特征)之间的距离实现分类。

  • 匹配网络(Matching Networks): 利用相似度度量方法,在少量标注样本与测试样本之间进行匹配。

  • 元学习(Meta-learning): 通过在多任务环境中训练,使模型学会如何从少量数据中迅速适应新任务。


3. 单样本学习(One-shot Learning)

定义: 单样本学习是一种极端的少样本学习情况,每个类别只有一个样本。模型需要从这一单一样本中捕捉类别特征,并在遇到新样本时作出正确判断。

特点:

  • 挑战性更大,因为样本信息非常有限。

  • 通常依赖于高效的特征提取和度量学习技术,或者借助数据增强、外部知识等手段来弥补数据不足的问题。


4. 监督学习(Supervised Learning)

定义: 监督学习是传统的机器学习范式,其中训练数据中每个样本都附有准确的标签,模型通过大量标注数据学习输入与输出之间的映射关系,从而在测试时对新数据进行预测。

特点:

  • 数据充足: 每个类别都有大量样本供模型学习。

  • 训练稳定: 有充足的数据支持下,模型能够获得较好的泛化性能。

  • 方法多样: 从简单的线性模型到复杂的深度神经网络均可采用。


5. 主要区别

学习范式数据量情况依赖辅助信息训练与泛化挑战
零样本学习目标类别:0 个样本强烈依赖类别间的语义信息、属性描述等如何利用辅助语义信息实现未知类别的泛化
少样本学习目标类别:极少(如 5 个)通常结合元学习或先验知识如何从极少的样本中学习到足够的类别特征
单样本学习目标类别:1 个样本同上,但数据极端稀缺需要极强的特征提取能力与相似度度量方法
监督学习目标类别:充足数据不依赖辅助语义信息(直接从数据中学习)数据标注充分,主要挑战在于如何避免过拟合、提升泛化能力

6. 其他“shot”范式及迁移学习中的延伸

除了上面讨论的零、少、单样本学习之外,在迁移学习和相关领域还有一些扩展和变种:

  • 多样本学习(Many-shot Learning): 指的是每个类别拥有大量样本的常规监督学习情形,有时也称为“常规学习”或“充分样本学习”。这其实就是大部分深度学习任务中使用的标准设置。

  • k-shot Learning: “k-shot”是一个通用术语,表示每个类别有 k 个样本。1-shot、5-shot、10-shot 等都是常见的具体情形。这个术语主要用于描述少样本学习的不同设定,通常在评估元学习算法时使用。

  • 低样本学习(Low-shot Learning): 与少样本学习相近,有时用来强调样本数极低的情况,通常涵盖 one-shot 和 few-shot 的情况。

  • 跨域少样本学习(Cross-domain Few-shot Learning): 指在训练和测试数据存在域差异(例如视觉领域与文本领域的跨域情况)时进行少样本学习,这要求模型具备更强的迁移能力。

  • 半监督少样本学习(Semi-supervised Few-shot Learning): 除了极少标注数据外,还利用大量未标注数据,通过半监督或自监督的方法来提升模型性能。

  • 元学习(Meta-learning): 虽然不直接以“shot”为命名,但元学习技术常用于实现少样本或单样本学习,通过在多任务训练过程中学会快速适应新任务,从而显著提升少样本场景下的泛化能力。


总结

  • 零样本学习 利用辅助语义信息,在没有任何目标类别样本的情况下进行预测,适合应对类别众多或不断扩展的应用场景。

  • 少样本学习单样本学习 则侧重于如何在只有极少数据的情况下提取足够信息进行分类,两者主要区别在于每个类别可用的样本数。

  • 监督学习 是依赖充足标注数据的传统方法,其难点在于数据采集与标注的成本。

  • 除此之外,“shot”范式还包括多样本(many-shot)、通用的 k-shot 以及一些结合跨域、半监督等情形的变体,都是为了应对现实应用中数据不足或数据分布差异等问题而发展出的迁移学习策略。

这些方法在实际应用中各有侧重,选择哪种范式往往取决于数据情况、任务需求以及计算资源的限制。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

AI Echoes

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值