Destruction and Construction Learning for Fine-grained Image Recognition

本文提出DCL方法,通过破坏学习(Destruction Learning)和构建学习(Construction Learning)增强细粒度图像识别。破坏学习利用Region Confusion Mechanism打乱图像,强调局部细节,再通过对抗学习减少噪声。构建学习则关注区域间的相关性建模,帮助网络理解对象结构。DCL在训练时不需要额外标注,推理时不增加计算开销。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Destruction and Construction Learning for Fine-grained Image Recognition

abstract

本文提出一种“破坏和构件的学习”简称为DCL的方法,来增加细粒度识别的难度,强行让分类模型获取专家的知识。提出的方法在训练期间不需要任何额外知识,在预测时除了标准分类网络外,没有计算开销。

1. Introduction

细粒度引起广泛研究,现在研究细粒度大都两种方法,第一:首先定位鉴别对象部分,然后根据鉴别区域进行分类,这些两步方法大多需要在对象或部件上添加额外的包围框注释,而收集这些注释的开销很大。第二:试图通过注意机制在无监督的情况下自动定位识别区域,因此不需要额外的标注,但是增加了额外计算。

因此作者提出了一种新的方法:先对图像进行打乱,这样可以强调局部细节。并且:一方面,DCL自动定位识别区域,因此在培训时不需要任何额外的知识。另一方面,DCL结构只在训练阶段采用,因此在推理时不会引入计算开销。作者认为在细粒度中,局部细节比全局细节更加重要,因为这些需要经细粒度识别的网络在大体上差不多,就是在细节上不相同,打乱之后,迫使进行局部细节识别。作者说这种打乱(文中称:RCM)并不是全优的,也有自己的缺点。RCM引入了几个嘈杂的可视模式。为了抵消负面影响,我们使用了一种对抗性损失来区分原始图像和破坏图像。因此,噪声模式的影响可以最小化,只保留有益的局部细节。从概念上讲,对抗性损失和分类损失以对抗性的方式工作,以仔细学习“破坏”。

2. Related works

就介绍了细粒度识别的方法,框架啥的。。

3. Proposed Method

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值