Image-Adaptive YOLO for Object Detection in Adverse Weather Conditions

该研究提出了一种名为IA-YOLO的新型图像自适应目标检测方法,旨在解决恶劣天气条件下的目标检测难题。IA-YOLO采用了一个可微分图像处理(DIP)模块,其参数由小型CNN预测,以适应性地增强图像并去除天气干扰。通过联合优化DIP、CNN-PP和YOLOv3检测网络,IA-YOLO在正常和恶劣天气条件下都能自适应地处理图像。实验结果显示,IA-YOLO在有雾和弱光场景中的检测性能优于现有方法。
用于恶劣天气条件下目标检测的图像自适应 YOLO

目录

Abstract

Introduction

Related Work

Object Detection

Image Adaptation

Object Detection in Adverse Conditions

Proposed Method

DIP Module

CNN-PP Module

Detection Network Module

Hybrid Data Training

Conclusion

论文原文

论文代码​​​​​​​

Abstract

尽管基于深度学习的目标检测方法已经在传统数据集上取得了可喜的结果,但现在从低质量图像,例如在恶劣的天气条件下捕获定位对象,仍然具有挑战性。现有方法要么难以平衡图像增强和目标检测,或者经常忽略潜在的有利于检测的信息。为了缓解这个问题,我们提出了一种新颖的图像自适应 YOLO (IA-YOLO)框架,其中每个图像都可以自适应地增强更好的检测性能。具体来说,提出了一个可微分图像处理(DIP)模块来考虑YOLO 探测器的恶劣天气条件,其参数由小型卷积神经网络 (CNN-PP) 预测。我们联合学习 CNN-PP 和 YOLOv3一种端到端的方式,确保 CNN-PP 可以以弱监督方式学习适当的 DIP 以增强图像。我们提出的 IA-YOLO 方法可以自适应地处理正常和不利的图像天气状况。实验结果非常好,证明了我们提出的 IA YOLO 方法在有雾和弱光场景中的有效性。

Introduction

基于 CNN 的方法已在目标检测中盛行(Ren et al. 2015; Redmon and Farhadi 2018)。他们不仅在基准数据集测试中取得了可喜的表现(Deng 等人,2009;Everingham 等人,2010;Lin 等人,2014),也在已部署在实际应用中,例如自动驾驶(Wang et al. 2019)。由于输入图像的域偏移(Sindagi et al. 2020),由高质量图像训练的通用目标检测模型在不利的天气条件下(例如,有雾和暗光)往往无法取得令人满意的结果。Narasimhan 和 Nayar (2002) 和 You 等人(2015)建议在恶劣天气下捕获的图像可以分解为清晰的图像及其对应的天气信息,而恶劣天气下的图像质量下降主要是由天气下信息和对象之间的相互作用引起的,这导致检测性能不佳。图 1 显示了一个在有雾的条件下对象检测示例。以看出,如果图像能够针对天气状况进行适当的增强,更多关于原始模糊对象的潜在信息和识别错误的对象可以恢复。

为了解决这个具有挑战性的问题,Huang、Le 和 Jaw(2020)采用两个子网络来共同学习可见性增强和对象检测,其中通过共享特征提取层来减少图像退化。但是训练的参数很难平衡检测和恢复。另一种方法是稀释影响通过预处理图像来获取特定于天气的信息,现有方法,例如图像去雾(Hang et al. 2020;刘等人。 2019)和图像增强(Guo et al. 2020)。然而,在这些方法中复杂的图像恢复网络需要通过像素级监督单独训练。这需要手动标记图像以进行恢复。这个问题也可以被视为无监督的域适应任务(Chen等。 2018; Hnewa 和 Radha 2021)。与训练有清晰图像(源图像)的探测器相比,假设在恶劣天气下拍摄的图像(目标图像)有分布转变。这些方法大多采用域适应原则,侧重于对齐两个分布的特征,而在基于天气的图像恢复过程中可以获得的潜在信息通常被忽略。

为了解决上述限制,我们提出了一个巧妙的图像自适应目标检测方法,称为 IA-YOLO。具体来说,我们建议使用完全可微分的图像处理模块(DIP),其超参数是自适应的,由基于 CNN 的小型参数预测器 (CNN PP) 学习。 CNN-PP 根据输入图像的亮度、颜色、色调和天气特定信息自适应地预测 DIP 的超参数。经DIP模块处理后,可以抑制图像中特定天气信息的干扰,同时恢复潜在信息。我们提出了一个联合优化方案学习 DIP、CNN-PP 和 YOLOv3 主干检测网络(Redmon 和 Farhadi 2018)以端到端的方式。为了增强图像进行检测,CNN-PP 是一种弱监督方式通过边界框注释,学习适当的 DIP。此外,我们利用在正常和恶劣的天气条件下的图像进行训练。通过利用 CNN-PP 网络,我们提出的 IA-YOLO 方法能够自适应地处理受不同程度天气影响的图像。图 1 显示了通过我们提出的方法的检测结果的示例。
这项工作的亮点是:1)提出了一个图像自适应检测框架,在正常和恶劣天气条件下有很好的表现;2) 提出一个 white-box 可微分图像处理模块,其超参数由弱监督预测网络训练得到; 3) 与以前的方法进行比较,在两个合成数据集上(VOC_Foggy 和 VOC_Dark)和真实世界数据集(RTTS 和 ExDar
### 跨域自适应教师模型的目标检测代码实现 #### 下载源码与数据集 为了获取 `Cross-Domain Adaptive Teacher` 的源代码,需执行以下命令来克隆仓库: ```bash git clone https://github.com/facebookresearch/adaptive_teacher.git ``` 这一步骤确保了开发环境中有最新的项目文件[^3]。 #### 安装依赖项 进入克隆下来的目录并创建虚拟环境以隔离项目的Python包管理。推荐使用Anaconda作为工具来进行此操作: ```bash cd adaptive_teacher conda create --name at python=3.8 conda activate at pip install -r requirements.txt ``` 上述指令会设置好所需的软件库版本以便顺利运行程序。 #### 数据准备 按照官方文档说明下载所需的数据集,并将其放置于指定路径下。通常情况下,这些资源会被存放在`datasets`文件夹内。具体位置取决于所使用的框架配置文件中的设定。 #### 配置训练参数 编辑配置文件(通常是`.yaml`格式),调整超参数如学习率、批次大小等,使之适合特定的任务需求。对于跨域场景下的微调工作尤其重要的是要仔细定义源域和目标域之间的映射关系[^1]。 #### 启动训练过程 通过脚本启动训练流程,在终端输入类似下面的命令即可开始实验: ```bash python tools/train_net.py --config-file configs/cross_domain_adaptation.yaml ``` 这里指定了一个用于描述整个网络架构及其优化策略的YAML配置文件。 #### 测试与评估 完成一轮或多轮迭代之后,可以利用预训练好的权重对新图像进行推理测试;也可以对比不同方法在同一验证集上的表现差异从而定量分析改进效果。 ```python from detectron2.engine import DefaultPredictor import cv2 cfg = get_cfg() cfg.MODEL.WEIGHTS = os.path.join(cfg.OUTPUT_DIR, "model_final.pth") # 加载最终模型 predictor = DefaultPredictor(cfg) im = cv2.imread("./input.jpg") outputs = predictor(im) print(outputs["instances"].pred_classes) ``` 这段简单的Python片段展示了如何加载保存下来的最佳模型并对单张图片做出预测。
评论 4
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值