[论文解读 2021-TIP] Revisiting Shadow Detection: A New Benchmark Dataset for Complex World

最新推荐文章于 2025-04-18 10:56:53 发布

Ws_Syx

最新推荐文章于 2025-04-18 10:56:53 发布

阅读量1k

点赞数

分类专栏：论文解读文章标签：计算机视觉深度学习

本文链接：https://blog.youkuaiyun.com/qq_36744580/article/details/119244980

版权

论文解读专栏收录该内容

1 篇文章

订阅专栏

该研究创建了CUHK-Shadow数据集，包含10500张带标签的复杂场景图片，用于影子分割任务。数据集具有多种挑战性特征，如不同比例的阴影面积、多阴影数量和分布以及低对比度的非阴影区域。提出了Fastshadowdetectionnetwork(FSDNet)，利用MobileNetV2作为骨干网络，结合细节增强模块(DEM)以提升阴影检测性能。实验结果表明，FSDNet在保持高效的同时，提高了分割精度。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在这里插入图片描述

该论文聚焦于影子的分割（segmentation），创新点在于提出新的数据集和一种局部特征增强方法。

创新点1：自建的数据集CUHK-Shadow：

1. 数据集的特点

10500张带标签的图片；更复杂的场景；
包含了投射到背景物体上的投影，也包含了投射到自身的投影；
提供了测试集；
数据集里的图片有5个不同的来源，分别是ADE20K、KITTI、Google MAP、USR、Internet，每个部分都有独立的划分出数据集，在后文作者的实验部分即对总体数据集进行了性能的评估，也分别对五个部分独立地进行了试验评估。

2. 数据集的复杂性

2.1 阴影面积的相对于图片总面积的占比（更复杂）

在这里插入图片描述

2.2 每幅图片的阴影个数更多、方差更大

在这里插入图片描述

2.3 阴影区域有着更均匀的空间分布

在这里插入图片描述

2.4 非阴影区与阴影区的颜色对比度（比以往的数据集更低）

在这里插入图片描述
PS. 现有的数据集

3. 评价指标：

3.1 Balanced error rate (BER)【越小越好】

在这里插入图片描述
传统的BER指标用来评价二分类（0/1）结果，于是对指标进行一些改进来适用连续（0~1）的预测结果：

3.2 f_β^ω【越大越好】

在这里插入图片描述

创新点2：Fast shadow detection network (FSDNet)

在这里插入图片描述

3.1 骨干网络：MobileNet V2【先前已有的工作】

在这里插入图片描述

首先，使用 MobileNet V2 作为具有一系列反向残差瓶颈 (IRB) 的主干来提取多个尺度的特征图。每个 IRB 包含一个 1×1 卷积、一个 3×3 深度卷积和另一个 1×1 卷积，并通过跳跃连接添加输入和输出特征图。此外，它在每次卷积后采用批量归一化，在前两次卷积后采用 ReLU6。其次，我们在主干的最后一个卷积层之后使用方向感知空间上下文 (direction-aware spatial context, DSC) 模块来收集 DSC 特征，其中包含用于识别阴影的全局上下文信息。