【论文阅读】A DEEP CNN METHOD FOR UNDERWATER IMAGE ENHANCEMENT的详解

论文:A DEEP CNN METHOD FOR UNDERWATER IMAGE ENHANCEMENT
作者:Yang Wang
年份:2017
期刊: IEEE International Conference on Image Processing


在这里插入图片描述

摘要

本文提出一个名为UIE-Net的基于CNN的水下图像增强框架,为更好地提取局部块中的固有特征,首次提出了一种像素破坏策略,可以有效提高收敛速度和准确性。该框架包含两个子网:CC-Net,HR-Net。CC-Net在不同通道内输出色彩吸收系数,用于校正水下图像的色彩失真。 HRNet输出光衰减的透射图,该图用于增强水下图像的对比度。

1 介绍

优点

1.该映射可从输入的水下图像估计色彩校正的图像和透射图,在目标场景上不需要额外标签
2.UIE-net接受了两项任务的训练:色彩校正和去雾,
3.像素破坏策略用于抑制局部块中包含的微小纹理的干扰,提高了学习过程的收敛速度和准确性。
4.合成数据集包含不同程度的颜色失真和雾度。提出的深层网络(UIE-Net)使用合成的水下图像进行训练。UIE-Net具有两个分支:色彩校正网络(CC-Net)和去雾网络(HR-Net),它们可以分别输出色彩校正的图像和透射图。

现有的水下图像增强方法

现有的水下图像增强方法可以分为两大类:
(1)基于图像的算法:直接从捕获的水下图像估计透射图,然后用于颜色校正和去雾
(2)基于模型的算法:考虑了水下光学特性,以更好地描述成像过程。
共性:利用各种假设,导致在特定场景工作的不太好。
本文提出了基于卷积神经网络(CNN)的跨场景水下图像增强的端到端框架,目标是学习从水下图像到色彩校正图像和透射图的映射,然后将其用于跨场景水下图像增强。

需要克服的挑战

(1)不同的水下场景具有不同的色彩失真和光学透射率。先前工作使用的各种假设/约束对跨场景的适应性较低。
(2)水下图像经常遭受颜色失真和模糊成像。由于色彩失真和模糊成像之间存在相互联系,因此难以提取图像特征以将水下图像映射到色彩校正的图像和透射图。
(3)假设局部变化在一个小区域内恒定的,但在图像块中包含的微小纹理对这个假设会引入干扰。直接使用很难获得好的结果。
(4)在训练水下图像增强的深度模型时,还没有大量的标记数据可供采集,这些标记数据包括水下场景的清晰和退化图像对。

2 提出的方法

2.1 水下成像模型

所捕获的水下图像主要由两部分组成:(1)物体表面反射的光的直接透射(2)水中存在的悬浮颗粒散射的光的透射。
在这里插入图片描述
UIE-Net的层设计包括:S-Net,CC-Net,HR-Net

2.3 像素破坏策略

UIE-Net使用了以前的假设:假设图像块中的颜色失真和雾度是恒定的。局部平滑度假设对于水下图像增强至关重要。但是,图像块中包含的空间信息(例如,细小的纹理,有色的噪点)可能对颜色校正和除雾引入干扰。首先,微小的纹理会打乱块的平滑度。其次,学习到的特征可能会受到微小纹理和噪点的影响,这会妨碍颜色校正和除雾。为了抑制这些干扰,提出像素破坏策略:破坏块中的所有像素,这可以抑制微小的纹理和颜色噪声的干扰,而不会改变颜色失真和雾度的任何特征。

3 实验

UIE-Net采用破坏策略的训练损失和测试损失比采用通用数据的少。
图像的熵越高意味着该图像中包含更多信息;PCQI越高意味着图像的对比度越好

结果

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

04-01
### UIE-Net 的介绍 UIE-Net 是一种基于自然语言处理(NLP)技术的统一信息抽取框架,旨在解决多模态场景下的复杂信息提取任务。它通过融合大规模预训练模型的能力,在结构化数据生成、实体关系识别以及事件抽取等方面表现出卓越性能[^1]。 #### 原理概述 UIE-Net 的核心原理在于利用 Transformer 架构的强大表示能力,结合特定设计的任务适配层完成多种 NLP 子任务。具体而言,该网络采用端到端的方式联合建模多个子任务之间的关联性,从而提升整体效果。例如,在实体识别过程中引入上下文感知机制,使得模型能够更好地理解语义背景并提高准确性。 此外,为了增强泛化能力和鲁棒性,UIE-Net 还采用了对比学习策略对齐不同分布的数据集特征空间,进一步优化跨领域适应表现。 ```python import paddle from paddlenlp.transformers import UIEModel, AutoTokenizer tokenizer = AutoTokenizer.from_pretrained("uie-base") model = UIEModel.from_pretrained("uie-base") text = "公司计划推出新产品" inputs = tokenizer(text, return_tensors="pd", max_length=512, truncation=True) outputs = model(**inputs) start_prob, end_prob = outputs.start_logits, outputs.end_logits ``` 上述代码展示了如何加载 PaddleNLP 中提供的 `UIE` 预训练模型及其分词器,并执行简单的输入编码操作以获取预测结果的概率分布向量。 #### 实现细节 在实现层面,UIE-Net 主要依赖于以下关键技术: 1. **Transformer 编码器**:作为基础架构部分负责捕捉序列中的长期依赖关系; 2. **条件随机域 (CRF)** 层用于改进标签路径的一致性和连贯度; 3. **多头注意力机制** 提升局部模式捕获效率; 这些组件共同作用下实现了高效而精确的信息抽取功能。 #### 应用场景 由于其强大的通用性和灵活性,UIE-Net 可广泛应用于各类实际业务需求之中,包括但不限于以下几个方面: - 自动摘要生成:快速提炼文档主要内容要点; - 舆情监控分析:实时跟踪社交媒体上热点话题动态变化趋势; - 法律合同解析:精准定位条款位置便于后续审查工作开展; 综上所述,无论是学术研究还是工业生产环境里,UIE-Net 都展现出了巨大潜力价值所在。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值