【论文阅读】A Deep Learning Approach for Underwater Image Enhancement

本文介绍了一种利用深度学习技术进行水下图像增强的方法,由Javier Perez于2017年提出。该方法通过训练卷积神经网络,以单个图像为输入,实现图像除雾和色彩恢复,其性能优于传统图像增强技术。实验表明,此方法在处理不同位置和特征的水下图像时具有良好的泛化能力。

论文:A Deep Learning Approach for Underwater Image Enhancement
作者:Javier Perez
年份:2017年
期刊: International Work-conference on the Interplay Between Natural & Artificial Computation

由于水中的光透射,水下机器人中的图像处理是自主水下机器人中最具挑战性的问题之一。 尽管图像恢复技术能够正确去除降级图像中的雾度,但它们需要来自同一位置的许多图像,因此无法在实时系统中使用它。本文提出了一种深度学习解决方案。卷积神经网络使用图像恢复技术进行训练,以对单个图像进行除雾,其性能优于其他图像增强技术。所提出的方法能够以单个图像作为输入来产生图像恢复质量图像。使用来自不同位置和特征的图像对神经网络进行验证,以证明泛化能力。

介绍

由于吸收,散射,海洋积雪或渐晕,图像会遭受不同的降解效应,使场景解释成为问题。机器人距离相机更深或更远,吸收会减少光量,颜色会根据其波长逐一减少。这种作用是水下图像偏蓝的原因,因为该波长在介质中的衰减最小。散射效果改变了相机的光线方向,从而产生了特征性的面纱,该面纱将自身叠加在图像上并隐藏了模糊物体的场景。海洋积雪的小漂浮颗粒增加了散射光的数量。渐晕是由镜片的几何形状(有时是由镜片的外壳)引起的,在图像角部的强度方面的淡入淡出。
需要一个预处理步骤以恢复原始颜色并增强图像以进行进一步处理。图像恢复使用退化模型和获取的图像模型恢复退化图像。缺点:图像恢复可产生更逼真的结果,但需要估计或测量多个参数,很难在实时系统中使用。

方法

根据图像特性将图像分为6组(岩石,海带,沙子和岩石,浅珊瑚,中珊瑚,深珊瑚)。每个数据集都组织在一个训练和测试集中,其中的图像是随机选择的以测量训练效果。图2,神经网络将整个图像作为输入并经过6个卷积步骤。第一个,图像大小在一个额外的池步骤中减少,提取最相关的特征。每个卷积步骤(除最后一个)还包括一个整流器线性单元(ReLU)层作为激活函数。对于每个卷积层,提取的特征数量从原始图像的3个初始(RGB)到五步后增加到55个。最后的神经网络步骤中将特征组合在一起,生成3个特征的矩阵,这些矩阵对应于还原的图像,将l2损失函数用作最小函数。l2损失最小化意味着将恢复的图像与神经网络估计的图像之间的强度差异最小化。神经网络学习执行与恢复方法相同的变换。
在这里插入图片描述

比较

用于训练的恢复方法需要深度图和整个图像数据集,而神经网络只需要单个图像。
评估神经网络预测图像的精度,用两种方法比较:
(1)直方图均衡化,它分析原始图像的直方图并将其移动以遵循所需的分布.
(2)自动色彩增强(ACE),该技术基于人类视觉系统的简单模型来增强图像

缺点:计算复杂

实验

实验一:本文方法比直方图均衡化和ACE都好,ACE更接近目标图像,直方图均衡化产生的颜色会恶化,产生真实对象中不存在的假颜色。
实验二:本文方法更接近ACE,但是神经网络时间比ACE短,ACE比直方图均衡化好。

### Shallow-UWnet Compressed Models for Underwater Image Enhancement Details and Implementation #### Model Architecture Overview Shallow-UWnet is a lightweight neural network designed specifically to address the challenges associated with water under image enhancement while maintaining high performance efficiency. The model achieves this through significant parameter reduction, requiring only one-eighteenth of trainable parameters compared to traditional deep learning models[^2]. This design choice not only reduces computational overhead but also enhances testing speed by up to ten times. #### Key Features The architecture of Shallow-UWnet incorporates several key features that contribute to its effectiveness: - **Parameter Efficiency**: By reducing the number of layers and optimizing each layer's structure, Shallow-UWnet minimizes the total amount of required training parameters. - **Enhanced Speed**: Optimized convolution operations allow faster inference without compromising on accuracy or quality of output images. - **Generalizability Across Datasets**: Despite being shallow, the model demonstrates strong generalization capabilities across different datasets containing various types of degraded underwater imagery. #### Implementation Example Below is an illustrative Python code snippet demonstrating how such a model might be implemented using TensorFlow/Keras framework: ```python import tensorflow as tf from tensorflow.keras import layers, models def create_shallow_uwnet(input_shape=(None, None, 3)): inputs = layers.Input(shape=input_shape) # Initial Convolution Layer conv1 = layers.Conv2D(64, (7, 7), padding='same', activation='relu')(inputs) # Depthwise Separable Convolutions for Efficient Processing depth_sep_conv = layers.DepthwiseConv2D((3, 3), padding='same', use_bias=False)(conv1) pointwise_conv = layers.Conv2D(64, (1, 1), padding='same', activation='relu')(depth_sep_conv) # Output Layer outputs = layers.Conv2D(3, (1, 1), activation='sigmoid')(pointwise_conv) return models.Model(inputs=inputs, outputs=outputs) model = create_shallow_uwnet() model.compile(optimizer='adam', loss='mse') ``` This simplified version showcases basic components like initial large kernel size convolution followed by efficient separable convolutions which help reduce overall complexity yet retain essential spatial information necessary for effective denoising and color correction tasks specific to underwater environments.
评论 1
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值