自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Angelina_Jolie的博客

欢迎喜欢计算机视觉的友友们一起交流~

  • 博客(135)
  • 收藏
  • 关注

原创 ACM MM‘24 | DMFourLLIE:用于低光照图像增强的双阶段多分支傅里叶网络

在傅里叶频域中,亮度信息主要编码在幅度分量中,而空间结构信息则大量包含在相位分量中。现有的利用傅里叶变换的低光照图像增强技术主要集中在放大幅度分量和简单复制相位分量,这种方法常常会导致颜色失真和噪声问题。在本文中,作者提出了一种双阶段多分支傅里叶低光照图像增强(DMFourLLIE)框架,通过强调相位分量在保留图像结构和细节方面的作用来解决这些限制。第一阶段整合红外图像的结构信息来增强相位分量,并在亮度 - 色度颜色空间中采用亮度注意力机制,以精确控制幅度增强。

2025-03-18 14:55:09 503

原创 LapLoss:多尺度图像增强的新利器

在每个层次上,生成图像和真实图像之间的差异被计算为损失,并通过加权平均的方式将这些损失结合起来,形成最终的损失函数。在每个层次上,生成器生成的图像与真实图像之间的差异被计算为损失,并通过加权平均的方式将这些损失结合起来,形成最终的损失函数。该方法通过拉普拉斯金字塔将图像分解为多个层次,每个层次对应不同的分辨率,从而捕捉到图像的高层次特征,同时保留低层次的细节和纹理。具体来说,LapLoss通过在每个金字塔层次上计算损失,平衡了图像的重建精度和感知质量,从而在多种光照条件下都能生成高质量的图像。

2025-03-18 14:49:39 503

原创 手机夜间拍照神器!DiffPGD:个性化低光图像去噪与增强

为了解决这一问题,本文提出了一种基于扩散模型的个性化生成去噪方法(DiffPGD),通过利用用户手机中的个性化照片库,构建定制化的扩散模型,从而在低光环境下实现更好的图像去噪和增强。DiffPGD的关键创新在于引入了身份一致的物理缓冲区,该缓冲区从用户的照片库中提取出人物的物理属性(如表面几何和皮肤颜色),并将其作为强先验信息,指导扩散模型的生成过程。具体来说,DiffPGD通过从用户的照片库中提取身份一致的物理缓冲区,并将其作为先验信息集成到扩散模型中,从而在不需要微调的情况下恢复退化的图像。

2025-03-17 08:53:44 933

原创 AIIE:基于DCT频率先验的全包容低频干扰图像增强

在实际场景中,图像常因各种恶劣天气条件,如雾霾、水下环境、低光照等,出现清晰度下降、细节模糊、对比度降低等问题,导致场景可见性变差。这些低质量图像不仅影响人们的视觉感受,还会对后续的计算机视觉任务,如目标识别、图像分割等造成阻碍。因此,图像增强技术至关重要,它旨在提升图像质量,改善图像的视觉效果,增强细节和对比度,从而提高后续任务的执行效率和准确性。本文提出的全包容图像增强(AIIE)方法,针对多种受天气影响导致低频干扰的图像退化问题,提供了一种统一的解决方案。

2025-03-15 10:33:16 779 1

原创 【AAAI 2025】基于离散余弦变换的全频谱空间注意力,增强网络特征学习,即插即用!

在CIFAR-10数据集上,使用ResNet19和ResNet20模型分别在2和4时间步长下取得了94.72%和96.52%的准确率。然而,SNNs中脉冲生成的固有稀疏性导致中间输出脉冲的深入分析和优化常常被忽视,这限制了SNNs的固有能量效率,并减少了其在时空特征提取方面的优势,导致准确度不足和不必要的能量消耗。1. 实验设置:在多个广泛使用的架构上进行了综合实验,使用了静态数据集CIFAR-10、CIFAR-100和ImageNet,以及动态数据集CIFAR10-DVS。浙江大学计算机科学与技术学院;

2025-03-15 10:31:09 1032

原创 SVDC模型:手机上的深度估计革命

这些注意力图指导AFSF模块在不同区域应用不同大小的卷积核,从而实现对高频细节的保留和对低频区域异常高频噪声的抑制。最后,通过深度头得到初步深度图,并使用特征引导的像素shuffle模块进行精细化处理,得到最终的高精度深度图。然而,现有方法难以有效处理dToF传感器的稀疏深度图,它们通常受到物理成像原理带来的巨大噪声影响,直接应用这些方法并不足以解决dToF数据的特定挑战。图6. 在TartanAir数据集上的定性结果显示,未添加窗口一致性监督时,不同窗口间帧的边界处出现明显的闪烁现象。

2025-03-15 10:21:54 704

原创 事件相机遇上Retinex理论,低光图像增强新突破

ERetinex的成功主要归功于其创新的双模态增强策略,该策略充分利用了事件相机的高动态范围和时间分辨率,以及传统图像的丰富色彩信息。在实验中,事件数据和图像数据的融合显著提升了照明估计的准确性,确保在低光条件下图像细节和色彩的完美再现。此外,采用了一种有效的融合策略,将事件相机的高动态范围数据与传统图像的色彩信息结合,从而生成更清晰、细节更丰富的图像。ERetinex框架通过结合事件相机的高动态范围数据和传统图像的色彩信息,提供了一种创新的方法来增强图像质量,在极端光照条件下保持视觉信息的完整性。

2025-03-14 10:30:42 697

原创 【数字图像处理】频率域图像增强:用傅里叶变换揭开图像细节的秘密

频率域图像增强通过将图像转换到频率域,针对性地调整频率分量,达到改善图像对比度和细节的目的。

2025-03-14 10:26:58 530

原创 (ACCV 2024)基于小波变换的Mamba与傅里叶调整的低光照图像增强

WalMaFa通过结合小波变换的低频分量和傅里叶变换的相位分量,实现了全局亮度和局部细节的平衡。作者通过实验发现,小波变换的低频LL分量在增强全局亮度方面优于傅里叶变换的幅度分量,而傅里叶变换的相位分量在恢复局部细节方面优于小波变换的高频分量。在LOL-v1、LOL-v2-real和LOL-v2-syn数据集上,WalMaFa在PSNR和SSIM指标上均优于或接近现有最先进的模型。设计了一种编码器-潜在层-解码器结构,结合小波和傅里叶变换的优势,实现了低光照图像的高质量增强。

2025-03-12 15:39:50 939

原创 (AAAI 2025) 基于生成感知先验的低光照图像增强

尽管在增强低光照(LL)图像的可见性、恢复纹理细节和抑制噪声方面取得了显著进展,但由于现实场景中复杂的光照条件,现有的低光照图像增强(LLIE)方法在实际应用中仍面临挑战。此外,生成视觉上逼真且吸引人的增强效果仍然是一个未被充分探索的领域。针对这些挑战,作者提出了一种新颖的LLIE框架,该框架通过视觉语言模型(VLMs)生成的生成感知先验(GPP-LLIE)进行指导。具体来说,作者首先提出了一种管道,引导VLMs评估LL图像的多个视觉属性,并将评估结果量化为全局和局部感知先验。

2025-03-11 21:21:44 941

原创 【CVPR 2024】状态空间对偶+多阶段状态融合+高效视觉Mamba模块

本文提出了一种新型的视觉架构Efficient Vision Mamba (EfficientViM),它基于隐藏状态混合器的状态空间对偶性(HSM-SSD),能够以更低的计算成本高效捕捉全局依赖关系。通过重新设计SSD层,将通道混合操作置于隐藏状态中,并引入多阶段隐藏状态融合,进一步增强了隐藏状态的表示能力。实验结果表明,EfficientViM在ImageNet-1k数据集上实现了新的速度-精度权衡,在高分辨率图像和知识蒸馏训练时也表现出显著的性能提升。ImageNet-1K 分类上各类模型的比较。

2025-03-10 09:12:32 1300

原创 PGH2Net:高效去雾新方法,性能超越SOTA!

本文提出了一种基于三重先验的层次化去雾网络PGH2Net,通过引入亮通道、暗通道和直方图均衡化先验,显著提升了去雾效果,并在多个数据集上超越了现有方法。为了验证PGH2Net的有效性,本文在多个数据集上进行了实验,包括室内合成数据集(SOTS-Indoor)、室外合成数据集(SOTS-Outdoor)以及两个真实世界数据集(Dense-Haze和O-HAZE)。可以看到,PGH2Net能够有效去除雾霾,恢复出清晰的图像细节,尤其是在红色框标注的区域,PGH2Net的表现明显优于其他方法。

2025-03-07 10:18:52 599

原创 (EAAI)DFP-Net:一种用于单图像去雾的无监督双分支频域处理框架

无雾图像是许多计算机视觉任务的前提条件,因此单图像去雾在该领域尤为重要。然而,现有的深度学习去雾方法面临以下问题:(1)先前去雾方法在恢复图像可见性方面的巨大潜力被忽视;(2)大多数深度学习去雾方法主要利用空间信息,却忽略了图像不同频域中的信息;(3)由于缺乏成对的有雾和清晰图像,这些方法的去雾能力有限。因此,作者提出了一种新颖的无监督去雾网络DFP-Net,以解决上述三个问题。具体而言,作者将暗通道先验算法嵌入到网络中,结合了先验方法和深度学习方法的优势。

2025-03-06 15:40:54 1343

原创 (CVPR 2025)突破低光照图像增强瓶颈!你只需要一个HVI色彩空间

将HV与I-Map按通道连接后,即可得到sRGB格式图像的HVI-Map。(1)极坐标化HS平面,让相邻的红色区域在数学上更连续,彻底消除断裂式噪点(见图1c),确保颜色空间内相似色彩的欧氏距离最小化,提高红色区域内的信噪比。(2)HVI引入了一个可学习的光强压缩函数(Ck),动态压缩低光区域强度,抑制噪声,同时保留高光细节,维持色彩空间级别的更高信噪比(见图1d)。如表4,图5,和图6,消融实验表明,我们所提出的光强压缩函数,HS极坐标化,和CIDNet的子模块均有效,获得了很好的定性与定量实验结果。

2025-03-06 15:29:58 1061

原创 (ECCV2024)Histoformer:基于直方图Transformer的恶劣天气图像恢复新文章

题目:Restoring Images in Adverse Weather Conditions via Histogram Transformer论文地址: https://arxiv.org/pdf/2407.10172代码地址: https://github.com/sunshangquan/Histoformer。

2025-03-04 09:00:00 1599

原创 (CVPR 2024) FourierDiff:零样本扩散模型,突破低光增强与去模糊瓶颈

提出了一种基于,能够地同时完成,在的情况下,在真实世界场景下取得了。传统方法改善亮度但无法处理模糊,导致增强后的图像仍然模糊。传统方法在低光照环境下表现不佳,假设图像拍摄于良好照明条件。(如 LEDNet)依赖于训练,,在真实场景下效果欠佳。如何在下,同时进行和,并取得的高质量图像?

2025-03-03 17:06:46 935 1

原创 (AAAI2024)CutFreq: 用于低级视觉增强的剪切和交换频率分量

论文题目。

2025-03-03 16:50:49 1019

原创 TIP 2024 | 在频率域中学习注意力以实现灵活的真实照片去噪

近年来,深度学习技术的进步推动了真实照片去噪领域的发展。然而,由于空间域中的固有池化操作,当前基于卷积神经网络(CNN)的去噪器偏向于关注低频表示,而丢弃了高频成分。这会导致视觉质量不佳的问题,因为图像去噪任务的目标是完全消除复杂的噪声并恢复所有细尺度和显著信息。本文从频率角度解决了这一挑战,并提出了一种新的解决方案,称为频率注意力去噪网络(FADNet)。作者的核心思想是构建一个基于学习的频率注意力框架,充分表征更广泛频率谱上的特征相关性,从而增强网络在多个频率通道上的表示能力。

2025-03-03 16:44:46 439

原创 皮尔逊、斯皮尔曼、肯德尔、最大互信息系数(MIC)、滞后相关性分析,直接运行!

它测量的是两个变量的等级之间的一致性程度,而不是直接测量它们的秩次之间的线性关系。斯皮尔曼相关系数:斯皮尔曼相关系数是一种基于秩次的非参数方法,用于衡量两个变量之间的单调关系。皮尔逊相关系数衡量的是两个变量之间的线性关系。皮尔逊相关系数在处理线性关系强的数据时非常有效,取值范围在 -1 到 1 之间,正值表示正相关,负值表示负相关,0 表示无关。通过相关性分析,我们可以了解变量之间的相互关系、依赖性,以及它们是如何随着彼此的变化而变化的。通过相关系数的值,我们可以判断它们的关系是强烈的、中等还是弱。

2025-03-03 16:36:22 435

原创 频域+卷积

文章介绍了Orchid,这是一种新型的序列建模方法,旨在解决注意力模型中的二次计算复杂度问题,同时不牺牲模型捕捉长距离依赖的能力。Orchid不仅在多种场景下一致性地超越了传统的基于注意力的架构,而且还扩展了可行序列长度,超越了密集注意力层的限制,这标志着在追求更高效、可扩展的深度学习模型方面迈出了重要一步。文章提出了一种名为LCR的新型交通时间序列数据插补模型,该模型结合了循环矩阵的低秩性质和拉普拉斯核的时间正则化,以捕捉全局和局部趋势。此外,该研究还探讨了将LCR模型应用于图像修复任务的可能性。

2025-01-18 11:30:08 368

原创 扩散模型=流匹配?谷歌DeepMind博客深度详解这种惊人的等价性

执行一个从 λ_t 到 λ_t+Δλ 的 DDPM 采样步骤完全等价于执行一个到 λ_t+2Δλ 的 DDIM 采样步骤,然后通过执行前向扩散重新噪声化到 λ_t+Δλ。但是,在汇总所有样本时,更新后得到的分布是相同的。人们普遍认为,这两个框架在生成样本的方式上有所不同:流匹配采样是确定性的,具有直线路径,而扩散模型采样是随机性的,具有曲线路径。在这篇博客的开头,作者们写道:「我们的目标是帮助大家能够自如地交替使用这两种方法,同时在调整算法时拥有真正的自由度 —— 方法的名称并不重要,重要的是理解其本质。

2024-12-13 15:47:30 802

原创 ECCV 2024 | 加速图像超分辨率网络的像素级分类

近年来,对于有效的超分辨率(SR)技术的需求激增,尤其是对于从2K到8K分辨率的大规模图像。对于基于深度神经网络(DNN)的单图像超分辨率(SISR),由于计算限制,通常需要将图像分解成重叠的块。在这样的块分解方案中,可以根据每个块的难度不同分配计算资源以进一步提高效率,同时保持SR性能。然而,这种方法有一个局限性:在块内均匀分配计算资源,导致包含不同恢复难度像素的块效率降低。为了解决这个问题,我们提出了一种新的方法,称为单图像超分辨率的像素级分类器(PCSR),它旨在自适应地在像素级别分配计算资源。

2024-11-26 10:29:05 1204

原创 即插即用频域增强通道注意力机制EFCAttention,涨点启动!

题目:FECAM: Frequency Enhanced Channel Attention Mechanism for Time Series Forecasting论文地址:https://arxiv.org/abs/2212.01209。

2024-11-26 10:24:27 2438 1

原创 ICLR 2025满分论文!利用一致光传输提升图像照明编辑效果

一致光传输的核心思想是,通过确保物体在不同照明条件下的外观的线性叠加与其在混合照明条件下的外观保持一致,从而为模型提供一个强有力的物理约束。这种一致性不仅支持模型在超过 1000 万张多样化样本上进行稳定的可扩展训练,也为图像的内在属性保持提供了保障。这种方法的有效性和灵活性使得其在多种数据来源的处理上具备广泛的应用潜力,包括真实照明阶段、渲染样本以及合成的野外数据。▲ 用户为对象图像和照明描述提供输入,我们的方法生成相应的对象外观和背景。

2024-11-26 10:19:25 1192

原创 深度学习创新之如何引入先验知识

传统深度学习具有以下几个问题:(1)黑盒特性使人难以相信其能获得可解释性强且与物理规律相一致的结果;(2)严重依赖于训练过程,在与训练数据分布不同的实际应用中泛化能力不佳;(3)依赖于大量的观测数据,数据的获取费时费力,且观测数据不可避免的缺失或误差可能导致深度学习结果无法达到令人满意的准确度。基于此,为改善数值机理模型和深度学习方法的局限性,结合经验、理论与计算科学范式知识的深度学习方法为研究者提供了新的思路。经验、理论、计算科学范式经历了长时间的发展,积累了丰富的知识与研究成果。在深

2024-11-21 12:00:00 2005 1

原创 关于学习小波分析

小波散射卷积网络的结构类似于CNN,不同的是其滤波器是预先确定好的小波滤波器,小波滤波器的参数不需要通过训练样本学习得到,其网络是非反馈式的。变速箱的主要功用包括:(1)能够改变传动比,按实际情况调整驱动轮转矩和转速,进而满足复杂的行车要求;(3)当档位处于空档位置时,汽车没有动力支持,所以即使在不熄车的情况下也能使汽车暂时停驻,便于汽车启动、怠速,换档或动力输出。非平稳信号的一种维格纳-维尔分布(WV分布)中交叉项的消除方法(基于滑动模式奇异谱分析)(MATLAB)正常工况(转速2000rpm)

2024-11-20 09:05:15 874

原创 CVPR 2025 看点:扩散模型如何颠覆零样本学习

具体来说,首先,我们使用了一个预训练的扩散模型,这是第一次在大量的语料库中训练的RGB图像框架中作为生成去噪器。关键的想法是使用扩散模型的去噪噪声图像的能力,给定一个标签的文本描述,作为该标签的可能性的代理。然而,大多数视觉语言的鉴别任务需要对仔细标记的数据集进行广泛的微调,以获得这样的对齐,而且需要花费大量的时间和计算资源。我们提出了一种新的基于扩散的框架,称为VGDiffZero,用于零镜头的视觉接地,没有任何额外的微调。我们表明,扩散模型对误导性的纹理线索是稳健的,实现了线索-冲突的最新结果。

2024-11-19 09:31:50 1130

原创 清华大学提出 TANet 用于综合恶劣天气图像复原的三重注意网络 !

虽然不同天气条件表现出不同的退化模式,但它们。

2024-11-19 09:27:36 1341

原创 NeurIPS 2024 | 无需训练,一个框架搞定开放式目标检测、实例分割

与此同时,在最近的研究中,大型视觉语言模型(VLM)显示出强大的物体识别泛化能力,例如,它可以在自动驾驶场景中的长尾数据上(corner case)识别非常见的物体,并给出准确的描述。之后,作者使用迭代式正负样本点采样的方式,从生成的注意力图中进行采样,得到 SAM 的点提示作为输入,最终得到物体的分割结果。本文提出了 VL-SAM,一个基于注意力图提示的免训练开放式目标检测和分割框架 VL-SAM,在无需训练的情况下,取得了良好的开放式 (Open-ended) 目标检测和实例分割结果。

2024-11-19 09:14:09 582

原创 降维和特征选择的对比介绍

特征降维和特征选择的目的都是使数据的维数降低,使数据维度降小。但实际上两者的区别是很大,它们的本质是完全不同的。

2024-11-08 20:30:59 595

原创 即插即用显著位置注意力spab,涨点起飞

题目:Salient Positions based Attention Network for Image Classification论文地址:https://arxiv.org/pdf/2106.04996。

2024-11-04 08:53:18 1040 1

原创 (ECCV 2024)即插即用小波变换卷积,引入频域信息,涨点起飞

题目:Wavelet Convolutions for Large Receptive Fields论文地址:https://arxiv.org/pdf/2407.05848。

2024-11-04 08:50:22 3038

原创 (arxiv 2024)即插即用多尺度注意力聚合模块MSAA,即用即起飞

题目:CM-UNet: Hybrid CNN-Mamba UNet for Remote Sensing Image Semantic Segmentation论文地址:https://arxiv.org/pdf/2405.10530。

2024-10-31 09:01:40 7977 5

原创 即插即用关系感知全局注意力模块RGA,涨点起飞

题目:Relation-Aware Global Attention for Person Re-identification论文地址:https://arxiv.org/pdf/1904.02998。

2024-10-31 08:56:50 1068 1

原创 小波下采样,即插即用

这篇论文利用频域的小波变化来进行降采样,图像经过小波变化会得到1个低频特征A,和3个高频特征H、V、D。常规的下采样操作普遍面临的信息损失问题,应用Haar小波变换来降低特征图的空间分辨率,可以更完整的保留图像的信息。代码非常简单,只有几行,我们非常简单的将其应用到我们的模型中,用于替换常规的下采样模块,像是卷积下采样、最大池化下采样、平均池化下采样等。

2024-10-31 08:53:45 960

原创 【TPAMI 2024】即插即用的FreqFusion特征融合模块

本文主要讨论了在计算机视觉领域中,特别是在(如语义分割、对象检测、实例分割和全景分割)中的一个新方法——。是一种用于改善计算机视觉任务中特征融合性能的方法。它通过适应性地平滑高级特征,使用空间变化的低通滤波器,并通过重采样附近类别一致的特征来替换高级特征中的不一致特征,从而解决了类别不一致和边界位移的问题。此外,还增强了低级特征的高频边界细节,以提高特征的高频功率并锐化边界。具有非常干净,用法简单的代码,FreqFusion 通过的频率特性,能够提高低分辨率和高分辨率特征的。

2024-10-28 16:53:50 4639

原创 即插即用特征融合FACMA和WCMF模块,涨点起飞

题目:FCMNet: Frequency-aware cross-modality attention networks for RGB-D salient object detection论文地址: https://www.sciencedirect.com/science/article/abs/pii/S0925231222003848频域跨模态注意力模块 (FACMA):作者提出了一种频率感知的跨模态注意力模块,以增强和选择 RGB 和深度图的互补特征。该模块设计了一个空间频率通道注意力(SFCA)

2024-10-28 16:36:39 2107

原创 (ICCV2023)多尺度空间特征提取模块,有效涨点,即插即用

题目:SAFMN:Spatially-Adaptive Feature Modulation for Efficient Image Super-Resolution期刊:CVPR (Conference on Computer Vision and Pattern Recognition)GitHub地址:https://github.com/sunny2109/SAFMN年份:2023作者单位:The Chinese University of Hong Kong (CUHK)

2024-10-28 16:30:27 3290

原创 (ECCV 2022)即插即用高效长距离注意力机制模块,涨点涨点涨点

题目:Efficient Long-Range Attention Network for Image Super-resolution论文地址:https://arxiv.org/pdf/2203.06697。

2024-10-24 20:26:46 1186

原创 TPAMI 2024 | 无监督光照适应低光视觉

光照不足对人类和机器视觉分析都带来了挑战。现有的低光增强方法主要关注人类视觉感知,往往忽略了机器视觉和高层语义。在本文中,我们首次构建了一个面向高层视觉的光照增强模型。借鉴相机响应函数的灵感,我们的模型可以从机器视觉的角度增强图像,尽管其架构轻量、公式简单。我们还引入了两种方法,利用基础增强曲线的知识和自监督预任务来训练不同的从正常光到低光的适应场景。我们提出的框架克服了现有算法的局限性,无需在低光条件下获取标注数据。它能够更有效地恢复光照和对齐特征,显著提高下游任务的性能,并可以即插即用。

2024-10-21 17:39:30 1136

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除