A Survey of Learning on Small Data(一)

本文概述了小数据学习的理论基础,包括主动学习和小样本学习。通过对不可知主动抽样的PAC框架分析,文章探讨了小数据学习的泛化误差和标签复杂性,并将其分为欧几里得和非欧几里得两种表示。同时,讨论了小数据学习在计算机视觉和自然语言处理等领域的应用前景。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

本文是《A Survey of Learning on Small Data》的翻译。原文链接

摘要

在大数据上学习为人工智能(AI)带来成功,但标注和训练成本昂贵。未来,在小数据上学习是人工智能的最终目的之一,它要求机器将依赖小数据的目标和场景识别如人类一样。一系列的机器学习模型正在以这种方式进行,如主动学习、小样本学习、深度聚类。然而,对于它们的泛化性能几乎没有理论保证。此外,它们的大多数设置是被动的,即标签分布由一个指定的采样场景显式控制。本综述遵循PAC(可能近似正确)框架下的不可知主动抽样,以有监督和无监督的方式分析小数据学习的泛化误差和标签复杂性。通过这些理论分析,我们从两个几何角度对小数据学习模型进行了分类:欧几里得和非欧几里德(双曲线)均值表示,并给出和讨论了它们的优化解。随后,总结了可能受益于小数据学习的一些潜在学习场景,并分析了它们的潜在学习场景。最后,还调查了一些具有挑战性的应用,如计算机视觉、自然语言处理,这些应用可能受益于对小数据的学习。

1. 引言

“那是一只睡在床上的猫,那男孩正在拍大象,那些人正在乘飞机&

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

UnknownBody

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值