- 博客(9)
- 收藏
- 关注
原创 传统低光图像增强方法
随着信息时代的到来,多媒体技术已经进入千家万户,视频图像作为感知世界的重要载体,已经成为人们不可或缺的信息资源。然而受到成像设备和照明条件限制,图像视频捕获过程中,由黑暗环境下带来的低对比度和成像设备带来的噪声往往极大限制了图片的质量,从而造成信息损失,同时降低人的感观体验,低光的照明环境同时也影响着计算机下游任务如(目标检测,人脸识别,语义分割)等,人的感知系统很难在有限的光照下捕获到图片的有效信息,在计算机视觉中,图像是三维的矩阵数据信息,如何捕获这些矩阵在数值上的分布和差异是反映图像信息的关键。
2025-01-10 13:26:17
1675
原创 常见低光图像增强数据集
早期的数据集通常用于传统和基于模型的方法,这对数据的数量和质量没有严格的要求,随着深度学习在低光图像增强领域的发展,一个优质的低光图像增强通常需要庞大且成对的数据集,首先得足够庞大,能够全面反映真实世界里问题、图像及概念的各种变化。接下来,我们会列举一些现有的典型数据集
2025-01-10 11:00:28
1783
原创 [图像增强]Empowering Low-Light Image Enhancer through Customized Learnable Priors
在低光条件下,图像可见度受限且含噪,影响下游任务,低光图像增强备受关注,现有方法分传统与深度学习两类。传统方法如基于 Retinex 理论虽能分解图像,但手工设计先验在复杂场景表现不佳。深度学习方法虽性能提升,但多构建黑盒网络,缺乏透明度与可解释性,像 URetinexNet 等虽改进但仍有不足。因此,作者提出探索定制可学习先验的潜力,利用 MAE 定制光照和噪声先验,从结构流和优化流重新开发,以提高深度展开范式的透明度和模型性能。
2024-12-13 12:01:07
1348
原创 【图像增强】U-shape Transformerfor Underwater Image Enhancement
本文讲述了一种水下图像增强的U形Transformer,本文发布在arXiv、SpringerLink、IEEE Xplore 等多个平台上,本文作者为 Lintao Peng(彭林涛)、Chun Li Zhu(朱春丽)和 Liheng Bian(边丽衡)。其中,彭林涛是北京理工大学的博士生,他的研究兴趣主要集中在计算成像和传感方面,特别是基于深度学习的复杂环境成像和传感技术,同时也在研究各种新型自注意力机制和损失函数以提高成像和传感网络的性能。
2024-12-06 15:31:53
1779
2
原创 【图像增强】Underwater Image Enhancement via Piecewise ColorCorrection and Dual Prior OptimizedContrast
本文发表于期刊IEEE Signal Processing Letters ,发表时间为 2023年 11 月。第一作者张东卫:中共党员,博士,河南科技学院信息工程学院校聘教授。长期从事低可视性图像增强、智慧农业、深度学习等方面的研究。翻译由于光的吸收和散射,水下采集的图像常常面临严重的质量退化问题。在本文中,提出通过分段颜色校正和双重先验优化对比度增强来解决上述问题。
2024-11-22 12:48:05
1431
原创 【图像增强】Underwater Image Enhancement via Minimal Color Loss and Locally AdaptiveContrast Enhancement
本文发表于期刊,发表时间为 2022 年 6 月。第一作者张东卫:中共党员,博士,河南科技学院信息工程学院校聘教授。长期从事低可视性图像增强、智慧农业、深度学习等方面的研究。翻译水下图像由于波长相关的光吸收和散射而存在色差和低可见度。针对这些退化问题,本文提出了一种高效、鲁棒的水下图像增强方法MLLE,该方法首先根据最小颜色损失原则和最大衰减映射指导的融合策略对输入图像的颜色和细节进行局部调整,然后根据最小颜色损失原则和最大衰减映射指导的融合策略。
2024-11-15 11:51:26
3674
3
原创 使用Alexnet训练cifar10数据集
AlexNet是一种深度卷积神经网络架构,由Alex Krizhevsky、Ilya Sutskever和Geoffrey Hinton开发。它于2012年被提交给ImageNet大规模视觉识别挑战赛(ILSVRC),并以很大的优势超过了之前最先进的模型,从而彻底改变了计算机视觉领域。AlexNet由8层组成,包括5个卷积层、2个最大池化层和3个完全连接层。卷积层负责从输入数据中学习特征图,而最大池化层对特征图进行下采样。完全连接的层采用扁平的特征图并输出类分数。
2023-05-25 00:16:23
3007
1
原创 VGG16网络的参数和FLOPs计算
VGG16是一种卷积神经网络(Convolutional Neural Network,CNN),是由Simonyan和Zisserman于2014年提出的用于图像识别任务的其中一种网络结构。VGG16网络包含13个卷积层和3个全连接层,在ImageNet数据集上表现出色,并成为后来CNN结构的基础。下面对VGG16网络的参数和FLOPs进行计算。
2023-05-23 16:59:41
5269
4
原创 多层感知器手写数字识别
多层感知器(Multilayer Perceptron,简称MLP)是一种前馈神经网络(Feedforward Neural Network)模型,由多个神经元组成。每一层通过非线性变换将输入映射到下一层,最终输出一个非线性的预测结果。MLP可以应用于分类、回归和其他机器学习任务。
2023-05-23 16:15:43
1415
3
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人