笔记：Few-Shot Learning小样本分类问题 + 孪生网络 + 预训练与微调

Hanley_Yeung

已于 2024-07-17 10:37:25 修改

阅读量2.7k

点赞数 53

分类专栏：机器学习神经网络图像处理文章标签：人工智能机器学习分类

于 2024-07-17 10:17:38 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/Yophan/article/details/140486480

版权

内容摘自王老师的B站视频，大家还是尽量去看视频，老师讲的特别好，不到一小时的时间就缕清了小样本学习的基础知识点~Few-Shot Learning (1/3): 基本概念_哔哩哔哩_bilibili

Few-Shot Learning（小样本分类）

假设现在每类只有一两个样本，计算机能否做到像人一样的正确分类？

这个例子Support Set有两类，每类只有一两个样本，靠这些样本，难以训练出一个深度神经网络，这个集合只能提供一些参考信息。对于小样本问题，不能用传统的分类方法。

小样本分类与传统的监督学习有所不同，小样本学习的目标不是让机器通过学习训练集中图片，知道哪类是什么样子；当我拿一个很大的训练集来训练神经网络后进行小样本分类，预训练模型的目的是让机器自己学会学习-----也就是学习事物的异同，学会区分不同的事物。

现在训练集有五类，其中并没有松鼠这个类别

训练完成之后，可以问模型这两张图片是否是相同的东西呢？这时候模型已经学会分辨了事物的异同，比如给出两张松鼠图片，模型知道这两个动物之间长得很像，模型能够告诉你两张图片很可能是相同的东西。

支持集

给出一张图片，神经网络不知道这是什么。

这时候就需要支持集（Support Set），每类给出少样本（1~2）张，神经网络将Query图片和支持集中的每个类别依次对比，找出最相似的。

训练集和支持集的区别

训练集规模很大，每类有很多张图片，可以训练一个深度神经网络
支持集每类只有一张或几张图片，不足以训练一个大的神经网络，只能在做预测时候提供一些额外信息。
用足够大的训练集训练的目的不是让模型识别训练集中的大象、老虎，而是知道事物的异同。对于训练的模型，只要提供含有该类别的小样本信息，模型就能区分类别，尽管训练集中没有这个类别。

小样本分类：Learn To Learn

带小朋友去动物园，小朋友不知道这个动物是什么，但是小朋友只需要翻一遍卡片（将目标与卡片上动物对应），就知道看到的动物是什么，这个卡片就是支持集，前提是小朋友有读卡片的能力，也就是得先经过训练学习。

如果卡片中每类只有一张，那就是One-Shot Learning（单样本学习）

传统监督学习和小样本学习步骤的区别

传统监督学习：测试图片虽然不是训练集中图片，但包含在训练集类别，模型已经见过上千张该类别图片，能够判断出是哪类。
小样本学习：测试图片不但不包含在训练集中，也不是训练集中的类别。所以小样本学习比传统监督学习更难。因为不是训练集中的类别，所以要提供支持集，提供更多信息（给模型看小卡片，每张卡片有一个图片和一个标签，模型发现测试图片和某张卡片相似度高，就知道测试图片属于哪个标签）

小样本学习两个术语

k-way ：支持集含有的种类数
n-shot ：支持集中每个种类有多少张图片

小样本学习预测准确率

横轴是支持集类别数量。随着类别数量增加，分类准确率会降低。
比如从三选一变成六选一
每类样本越多，做预测越容易

相似度函数

sim(x, x')， x,x'为两个input

理想情况：sim(x1,x2) = 1 , sim(x1,x3) = 0, sim(x2,x3) = 0

最低0.47元/天解锁文章

博客等级

码龄4年

44
原创

516
点赞

627
收藏

385
粉丝

关注

私信

热门文章

分类专栏

最新评论

笔记：Few-Shot Learning小样本分类问题 + 孪生网络 + 预训练与微调
viaChrisma: 通俗易懂，非常开门
【LeetCode力扣】007. 整数反转（Python）
穷苦书生_万事愁: 博主的这篇文章让我对整数反转这个题目有了全新的理解，内容深入浅出，让我受益匪浅。博主的细节描写非常到位，展现出了博主深厚的专业知识和功底。期待博主未来能够持续分享更多这样有价值的文章，同时也期待能够得到博主的指导和帮助，共同进步。真心感谢博主的分享和支持，让我受益良多。
【LeetCode力扣】003.无重复字符的最长子串（Python）
优快云-Ada助手: 恭喜你发布了第16篇博客！看到你分享了关于LeetCode力扣003题的解题思路，很有启发性。希望你能继续保持创作的热情，不断积累经验，可以尝试探索更多不同类型的题目，拓宽自己的知识面。期待你更多精彩的分享！祝你写作顺利，不断进步！
【LeetCode力扣】004.寻找两个正序数组的中位数（Python）
优快云-Ada助手: 恭喜您写了第17篇博客！看来您对LeetCode的题目有着深入的理解和研究。希望您能继续保持创作的热情，分享更多优质的内容给大家。下一步可以考虑结合实际案例或者加入更多的算法优化思路，让读者能够更好地理解和应用您的解题方法。期待您的下一篇作品！
实现图像直方图均衡化
优快云-Ada助手: 恭喜您在博客中成功实现了图像直方图均衡化！这是一个非常有趣和实用的主题，我相信您的文章一定能帮助到很多人。接下来，我建议您可以尝试探索一些与图像处理相关的深入主题，比如图像滤波、边缘检测等，相信您会有更多的收获和启发。期待您的下一篇精彩作品！祝您创作顺利，不断进步！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Hanley_Yeung 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。