【论文阅读】A Deep Learning Approach for Underwater Image Enhancement

最新推荐文章于 2025-09-01 15:56:57 发布

原创最新推荐文章于 2025-09-01 15:56:57 发布 · 1.1k 阅读

3 ·

CC 4.0 BY-SA版权

文章标签：

#神经网络 #机器学习 #卷积

论文专栏收录该内容

29 篇文章

订阅专栏

本文介绍了一种利用深度学习技术进行水下图像增强的方法，由Javier Perez于2017年提出。该方法通过训练卷积神经网络，以单个图像为输入，实现图像除雾和色彩恢复，其性能优于传统图像增强技术。实验表明，此方法在处理不同位置和特征的水下图像时具有良好的泛化能力。

论文：A Deep Learning Approach for Underwater Image Enhancement
作者：Javier Perez
年份：2017年
期刊： International Work-conference on the Interplay Between Natural & Artificial Computation

由于水中的光透射，水下机器人中的图像处理是自主水下机器人中最具挑战性的问题之一。尽管图像恢复技术能够正确去除降级图像中的雾度，但它们需要来自同一位置的许多图像，因此无法在实时系统中使用它。本文提出了一种深度学习解决方案。卷积神经网络使用图像恢复技术进行训练，以对单个图像进行除雾，其性能优于其他图像增强技术。所提出的方法能够以单个图像作为输入来产生图像恢复质量图像。使用来自不同位置和特征的图像对神经网络进行验证，以证明泛化能力。

介绍

由于吸收，散射，海洋积雪或渐晕，图像会遭受不同的降解效应，使场景解释成为问题。机器人距离相机更深或更远，吸收会减少光量，颜色会根据其波长逐一减少。这种作用是水下图像偏蓝的原因，因为该波长在介质中的衰减最小。散射效果改变了相机的光线方向，从而产生了特征性的面纱，该面纱将自身叠加在图像上并隐藏了模糊物体的场景。海洋积雪的小漂浮颗粒增加了散射光的数量。渐晕是由镜片的几何形状（有时是由镜片的外壳）引起的，在图像角部的强度方面的淡入淡出。
需要一个预处理步骤以恢复原始颜色并增强图像以进行进一步处理。图像恢复使用退化模型和获取的图像模型恢复退化图像。缺点：图像恢复可产生更逼真的结果，但需要估计或测量多个参数，很难在实时系统中使用。

方法

根据图像特性将图像分为6组（岩石，海带，沙子和岩石，浅珊瑚，中珊瑚，深珊瑚）。每个数据集都组织在一个训练和测试集中，其中的图像是随机选择的以测量训练效果。图2，神经网络将整个图像作为输入并经过6个卷积步骤。第一个，图像大小在一个额外的池步骤中减少，提取最相关的特征。每个卷积步骤（除最后一个）还包括一个整流器线性单元（ReLU）层作为激活函数。对于每个卷积层，提取的特征数量从原始图像的3个初始（RGB）到五步后增加到55个。最后的神经网络步骤中将特征组合在一起，生成3个特征的矩阵，这些矩阵对应于还原的图像，将l2损失函数用作最小函数。l2损失最小化意味着将恢复的图像与神经网络估计的图像之间的强度差异最小化。神经网络学习执行与恢复方法相同的变换。
在这里插入图片描述