9、通过领域自适应实现带噪声标签的可扩展图像分类器学习

kubernetes8ctl

于 2025-06-16 13:03:08 发布

阅读量57

点赞数

CC 4.0 BY-SA版权

分类专栏：领域自适应与深度学习：计算机视觉的新纪元文章标签：领域自适应噪声标签图像分类器

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/kubernetes8ctl/article/details/148779860

领域自适应与深度学习：计算机视觉的新纪元专栏收录该内容

13 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

通过领域自适应实现带噪声标签的可扩展图像分类器学习

1. 背景

大规模图像识别领域的进步很大程度上得益于像ImageNet和MSCOCO这样的大规模标记图像集合。然而，收集大规模的手动标记数据集通常是昂贵且耗时的，尤其是在需要领域专家进行细粒度识别的情况下。例如，特定领域的细粒度识别可能需要招募一组专家来标注数据，这使得数据收集更具挑战性。

在实践中，为了快速开发图像识别模型，通常会使用替代方法，例如使用带有用户提供的标签的网络图像或通过图像搜索引擎爬取的网络图像。这些方法虽然易于扩展，但也引入了噪声标签和领域偏移问题。许多研究表明，噪声标签会显著影响分类器的准确率，因此开发在存在噪声标签的情况下进行学习的算法变得尤为重要。

2. 人工监督的可扩展性与有效性之间的冲突

我们可以大致将之前为学习带有噪声标签的分类器提出的方法分为两类，这取决于是否涉及人类努力（或其他类型的高准确度监督信号）。

2.1 依赖人类努力的方法

最简单的方法是让标注工人审查整个数据集（例如从互联网上抓取的图像），并移除错误标注的实例。一个众所周知的例子是ImageNet数据集。一些大规模的训练数据，如LSUN数据集和Places数据集，是通过结合使用图像分类算法和人类半自动标记图像来构建的，从而放大了人类的努力。

这些方法虽然有效，但不具备可扩展性，因为它们需要为每个图像类别进行人类标注努力。对于有成千上万甚至更多类别的分类任务（也被称为极端分类任务），这种方法显然是不可行的。

2.2 不依赖人类努力的方法

相比之下，不依赖人类努力的方法，例如基于模型预测的过滤和无监督的异常值

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符 | 博主筛选后可见

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。