2025年了,小样本学习还可以继续做吗?可以参考这些登上Nature的小样本学习模型

部署运行你感兴趣的模型镜像

2025 年小样本学习仍然是一个具有研究价值和应用前景的领域,可以继续深入研究和探索,原因如下:

研究进展显著1:2023 - 2025 年间小样本学习取得了不少突破。如 2024 年发表在《Nature》上的 SBeA 框架,无需标签即可达到 90% 以上准确率,克服了小样本学习中的数据集限制。此外,开放世界小样本学习方法如 DyCE 和 OpTA 处理动态、不完整数据的能力有所提升,扩展了小样本学习的应用范围。

应用需求广泛:在医疗诊断领域,医疗影像分析和稀有疾病诊断等场景中数据标注成本高且样本稀缺,小样本学习可以利用少量标注数据进行模型训练,有助于疾病的早期检测和诊断1。在金融领域,如商业银行在开展新业务或针对某些细分业务场景构建模型时,往往面临数据样本量不足的问题,小样本学习技术可以帮助构建具有较强判别能力的智能模型,提升风险评估和精准营销等方面的能力7。在自然语言处理中,对于一些低资源语言或特定领域的文本处理,小样本学习能够通过少量的标注数据实现语言模型的训练和应用,如情感分析、文本分类等任务1。

技术不断创新4:扩散模型等新兴技术在小样本学习中得到应用和发展。例如,通过模拟数据在 “噪声” 状态与 “干净” 状态之间的转化过程,扩散模型能够生成多样化的合成样本来帮助模型更好地泛化,在图像生成、视频生成、文本生成等任务中展现出强大的表现力和生成能力,为小样本学习提供了新的方法和思路。


人工智能常面临数据匮乏难题,如医疗影像、稀有物种检测等场景,仅能获取数十至数百例高质量标注样本,传统模型易因数据不足过拟合。小样本学习旨在让模型通过1-5个标注样本快速适配新任务,打破“数据依赖”。

其核心挑战在于样本少导致的特征覆盖不足,以及新旧知识迁移难题。早期度量学习方法(如孪生网络)在复杂场景中性能有限。近年,元学习与预训练技术融合成主流:Transformer的上下文学习通过提示激活知识,实现小样本推理;图神经网络结合最优传输校准数据分布。这些技术推动模型在小样本下逼近传统精度,加速向医疗、遥感等数据敏感领域落地。

如果打算深入研究,建议看看我整理的12篇小样本机器学习论文,都是前沿成果,有参考会更容易找到思路,代码也附上了,方便各位复现。

2022-2025可复现论文合集https://docs.qq.com/doc/DQ25HbWt6WmdOZEta?u=7f01826fa3f140bb8e36e875087997e8&nlc=1

【论文1:Nature】Accurate predictions on small data with a tabular foundation model

方法

这篇论文提出的研究理论方法是利用上下文学习(ICL)机制,基于数百万合成表格数据集训练 Transformer 架构的 TabPFN 模型,使其能在单次前向传播中完成对新数据集的训练和预测,实现对小样本表格数据的高效建模。

创新点

 1. 开发出TabPFN模型,在小至中等规模数据集(最多10,000样本、500特征)上性能远超传统梯度提升决策树等方法,且训练时间大幅减少。

2. 引入基于结构因果模型(SCMs)的合成数据生成方法,使模型能学习处理真实数据中的缺失值、异常值等复杂挑战。

3. 实现表格数据的上下文学习,模型具备数据生成、密度估计、特征嵌入学习和微调等基础模型能力,拓展了小样本学习的应用场景。

论文链接:https://www.nature.com/articles/s41586-024-08328-6

【论文2】Enhancing Unsupervised Graph Few - shot Learning via Set Functions and Optimal Transport

方法

这篇论文提出的研究理论方法是在元训练阶段,通过图对比学习(GCL)提取实例级特征,利用神经集合函数构建正负样本对,进行集合级对比学习以捕捉集合级特征;在元测试阶段,基于最优传输原理校准支持集与查询集的分布,缓解分布偏移问题,最终利用校准后的支持集训练分类器实现小样本节点分类。该方法通过结合实例级与集合级特征学习,并引入分布校准机制,提升了模型在无监督图小样本学习中的性能。 

创新点

 1. 提出STAR模型,首次将集合函数与最优传输结合,分别用于提取图数据中的集合级特征和校准支持集与查询集的分布,解决了现有模型忽视集合级特征和分布偏移的问题。

2. 理论证明STAR能捕获更多任务相关信息,收紧泛化误差上界,增强了模型的理论可解释性和泛化能力。

3. 设计无监督图小样本学习框架,无需基础类标签数据即可进行元训练,适用于真实场景中标签稀缺的情况,拓展了小样本学习的应用范围。

论文链接:https://arxiv.org/abs/2501.05635**

您可能感兴趣的与本文相关的镜像

Yolo-v8.3

Yolo-v8.3

Yolo

YOLO(You Only Look Once)是一种流行的物体检测和图像分割模型,由华盛顿大学的Joseph Redmon 和Ali Farhadi 开发。 YOLO 于2015 年推出,因其高速和高精度而广受欢迎

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值