- 博客(22)
- 收藏
- 关注
原创 PSFusion代码复现记录
PSFusion是一种基于渐进语义注入和场景保真的红外与可见光图像融合网络。该网络采用双分支架构:语义感知分支用于预测边界、语义和分割结果,场景恢复分支利用语义信息重构源图像。核心模块包括浅层细节融合模块(SDFM)、深度语义融合模块(PSFM)和渐进语义注入模块(PSIM)。实验在MSRS、M3FD等数据集上进行评估,使用EN、SD等指标衡量融合性能。网络采用联合训练策略,使用SGD优化器,在YCbCr色彩空间处理颜色信息。源码已在GitHub开源,为高级视觉任务中的图像融合提供了新思路。
2025-06-28 22:58:15
829
原创 图像融合中损失函数【4】--复杂图像特征的损失函数
本文提出了一种新型红外与可见光图像融合网络PSFusion,通过渐进式语义注入和场景保真约束,有效克服现有方法的局限性。该网络包含场景恢复分支和稀疏语义感知分支,采用语义注入模块(SIM)将深层语义特征逐级整合到融合过程中,并通过场景保真路径确保重建能力。实验表明,PSFusion在视觉质量和语义保持方面优于现有方法,同时证明了图像级融合相比特征级融合的优势。该方法计算高效,能适应不同骨干网络,在恶劣条件下仍能提供优质融合结果,为高级视觉任务提供可靠支持。
2025-06-25 21:40:51
982
原创 图像融合中损失函数【3】--梯度&强度损失
本文总结了图像融合中的梯度损失。第一篇论文《Hierarchically Aggregated Fusion Architecture》设计了分层聚合融合架构,通过特征级和对象级模块提取互补特征,并构建专用搜索空间与协作搜索策略实现高效架构搜索。第二篇论文《Task-guided, Implicitly-searched and Meta-initialized Deep Model》提出TIM框架,将后续任务信息融入融合过程,采用隐式架构搜索和元初始化技术,实现跨任务的快速适应。
2025-06-24 22:10:46
1212
原创 图像融合中损失函数【2】--结构损失
本文研究了两种基于深度学习的红外与可见光图像融合方法:RFN-Nest和Image-Fusion-Transformer。RFN-Nest采用端到端的残差融合网络架构,通过两阶段训练策略(自编码器预训练和残差融合网络训练)实现图像融合,并提出了细节保留损失和特征增强损失函数。Image-Fusion-Transformer则利用Transformer的多尺度融合策略,结合CNN和Transformer分支来捕获局部和全局特征。两种方法均采用结构相似性(SSIM)损失和特征损失作为核心优化目标。实验结果表明,
2025-06-24 15:54:24
1150
原创 图像融合中损失函数【1】--像素级别损失
摘要:近年来,无监督红外和可见光图像融合领域取得显著进展。研究表明,损失函数的设计主要围绕像素级别、评估指标和数据特性三个维度展开。像素级损失(如L1、MSE)直接比较图像差异;结构相似性(SSIM)指标更符合人类视觉感知;基于数据特性的损失函数(如梯度、边缘特征)则能更好地保留纹理细节。多种创新性损失函数被提出,如视觉显著性图(VSM)和空间频率(SF)指标。在实现方面,DenseFuse、LRRNet和ReCoNet等代表性工作展示了不同的损失函数组合策略。其中,ReCoNet引入注册损失解决图像对齐问
2025-06-23 21:52:27
1304
原创 图像融合的评价指标
信息熵EN交叉熵CE互信息MI峰值信噪比PSNR空间频率SF标准差SD均方误差MSE视觉保真度VIF平均梯度AG相关系数CC差异相关和SCD基于梯度的融合性能Qabf结构相似度测量SSIM多尺度结构相似度测量MS-SSIM基于噪声评估的融合性能Nabf。
2025-06-23 14:53:05
968
原创 红外-可见光融合的显著目标检测【2】-IRFS
本文提出一种用于红外-可见光显著目标检测(RGBT SOD)的多交互双解码器网络。针对双模态特征融合的挑战,该方法设计了级联多交互模块和双解码器架构,实现不同层次特征的充分融合,同时避免模态间信息的过度影响。实验表明,该方法在RGBT和RGBD SOD任务上均表现优异。此外,文中还探讨了联合红外-可见光图像融合(IVIF)与SOD任务的创新思路,通过特征筛选融合网络(FSFNet)和融合引导增强模块(FGSE),构建双向优化框架(IRFS),实现两个任务的协同提升。所提方法在保持模型轻量化的同时,显著提升了
2025-06-21 10:45:36
902
1
原创 红外-可见光融合的显著目标检测【1】-Multi-Interactive Dual-Decoder for RGB-Thermal Salient Object Detection
文章摘要 本文提出了一种多交互双解码器架构用于RGB-热成像显著目标检测(RGBT SOD)。针对现有方法未能充分利用多模态互补信息的问题,作者设计了双解码器结构,通过多交互模块(MIB)实现模态间特征、多级特征和全局上下文之间的交互。该方法具有三大创新点:(1)在解码阶段进行模态融合,比编码阶段融合更易优化;(2)统一集成多类型交互形成鲁棒特征表示;(3)采用数据增强策略模拟无效模态情况提升模型健壮性。实验证明,该方法在公开RGBT和RGBD数据集上优于现有最优算法,尤其在处理噪声或缺失模态时表现突出。该
2025-06-19 22:06:49
1356
原创 COD任务论文——FGSA-Net
摘要:伪装物体检测(COD)的目的是对与周围环境表现出非常相似模式的伪装物体进行分辨。最近的研究表明,通过频率信息增强特征表示可以大大缓解前景物体与背景之间的模糊问题。随着 InternImage、Segment Anything Model 等视觉基础模型的出现,在 COD 任务中使用轻量级适配器模块对预训练模型进行适配成为一个新颖而有前景的研究方向。现有的适配器模块主要关注空间领域的特征适配。本文针对 COD 任务提出了一种新颖的频率引导空间适配方法。具体来说,我们将适配器的输入特征转换到频率域。
2025-04-22 14:49:44
972
原创 COD任务论文--MAMIFNet
MAMIFNet 通过密集部署我们提出的掩码和注意力调制快速傅立叶卷积(MAM-FFC 3.2)算子,实现了空间和频率域信息的有效融合。这些算子在空间-频率融合域中实现了掩码和注意力机制,使网络能够在每一层捕捉到丰富的场景理解信息,从而为准确的伪装物体检测奠定了基础。如图 2 所示,MAMIFNet 采用两阶段自下而上的渐进式检测策略。在第一阶段,(空间域)骨干网络和 K-Ways 融合模块协同完成空间特征聚合。具体来说,对于输入图像 I € R^HxWx3.
2025-04-10 21:24:21
1142
原创 AI Angent=智能体?
大语言模型大模型多模态大模型AI Agent智能体提示:以下是本篇文章正文内容,下面案例可供参考为什么研究随着模型和数据集的规模不断扩大,传统的MM 模型会产生大量计算成本关键问题不同类别的大模型都被单独训练过了, 那核心挑战是如何有效地将其他模式的LLM 算法模型连接起来,以实现协同工作。研究内容最初的研究主要集中在 MM 内容理解和文本生成方面,例如:图像-文本理解等任务此外还有视频-文本理解,音频-文本理解等项目。后来,MM-LLM 的能力被扩展到支持特定模态输出。
2025-02-28 18:10:12
966
原创 COD任务论文代码解读---BCNet
TJNet中的参考文献【31】:BCNet[31]通过使用高分辨率特征增强模块(HFEM)连接多个特征来增强特征表示,然后通过边界引导特征交互模块(BFIM)聚合多层特征以细化边界和整体特征,从而实现伪装目标分割。题目:Boundary-guided context-aware network for camouflaged object detection代码地址:伪装物体检测(COD)旨在识别和分割无缝融入周围环境的物体。
2024-11-20 21:55:16
721
原创 论文解读--TJNet
伪装对象检测 (COD) 需要识别图像中与背景混合的对象。然而,大多数传统的COD方法没有综合考虑对象的整体区域和边缘提供的信息。为了解决这个问题,针对 COD 提出了一种基于粗图和边缘图的新双引导联合网络。特别是,信息引导模块旨在将边缘和整体信息注入网络的主干特征中。同时,设计了基于跳跃连接和多尺度感知的特征观察模型来捕获多尺度图像细节和结构。为了避免低级特征中语义信息的丢失,设计了全图像注意力机制,将高级特征整合到低级特征中,从而提高了对象掩模的分辨率。
2024-11-18 22:49:13
539
2
原创 COD任务论文解读--FPNet
伪装物体分割(COS)旨在识别 “完美 ”融入其周围环境的物体,具有广泛的应用价值。COS 面临的主要挑战是候选对象与噪声背景之间存在很高的内在相似性。在本文中,我们努力迎接挑战,以实现有效和高效的 COS。为此,我们开发了一个生物启发框架,称为定位和聚焦网络(PFNet),它模仿了自然界中的捕食过程。具体来说,我们的 PFNet 包含两个关键模块,即定位模块(PM)和聚焦模块(FM)。
2024-11-15 21:20:44
1067
原创 【神经网络】 神经网络基础
机器学习、深度学习、神经网络 这几个相似名词,可以浅浅辨析一波。机器学习是一个广泛的概念,它包括了各种让计算机从数据中学习的技术和方法。神经网络是机器学习中的一个特定领域,它使用类似于人脑神经元的节点和连接来模拟学习过程。深度学习则是神经网络的一个子集,它利用多层神经网络结构来学习数据的深层表示,并在许多任务上取得了显著的性能提升。简而言之,机器学习是一个大的领域,神经网络是机器学习的一个子集,而深度学习是神经网络的一个进阶方向。
2024-06-20 13:55:46
2064
原创 软件测试--白盒测试
白盒测试就像是一个大盒子(想象成是一个软件或游戏),而我们知道这个盒子里面的所有东西是怎么摆放和工作的(就像我们知道软件里的代码是怎么写的)。我们的任务就是要打开这个盒子(查看代码),检查里面的每个部分是否都正常工作。
2024-06-10 22:11:45
1620
原创 【Cisco】 STP 生成树协议—功能验证实验
在此之前应该对OSI模型应该有过学习和了解,STP协议主要工作在第二层–数据链路层。首先,数据链路层就像是一条“数据通道”,负责将数据从一个节点传输到另一个节点。在这个过程中,数据链路层会对数据进行封装、分帧、物理寻址、媒体访问控制、传输和接收以及差错检测与纠正等一系列处理,以确保数据的可靠传输。通过这个实验可以体验到生成树协议的功能。STP的基本应用是防止交换机冗余链路产生的环路。在网络中,如果交换机之间存在多条路径(冗余链路),可能会形成环路,导致数据包在网络中无休止地循环传输,即所谓的广播风暴。
2024-06-04 15:01:50
2527
原创 【软件工程】软件测试方法--黑盒测试
黑盒测试的每种测试方法都有各自的优缺点,需要测试人员根据实际项目特点和需要选择合适的方法设计测试用例。在任何情况下都必须选择边界值分析方法。经验表明用这种方法设计出的测试用例发现程序错误的能力最强;必要时用等价类划分法补充一些测试用例;用错误推测法再追加一些测试用例;如果程序的功能说明中含有输入条件的组合情况,则可选用因果图法和决策表法。
2024-06-04 11:07:22
3009
原创 【软件工程】 软件测试概述
首先要明白一个软件测试是干嘛用的。软件和测试分开来看,软件是指不同功能的程序以及程序的处理对象(数据、与程序开发、维护和使用有关的文档资料);测试,可以从功能层面去理解,软件好不好,行不行运行,运行起来能不能达到客户想要的效果,那就要想办法试一试。软件测试正是发现软件中存在错误和缺陷的主要手段,而软件测试的过程就是发现并改正软件缺陷的过程。以上将软件测试的基本概念梳理了一遍,但是实际工作环境中的测试用例报告会更详尽一些。后续的关键测试方法,黑盒测试、白盒测试会放在下一个章节中。
2024-06-03 23:31:30
1326
原创 cisco交换机功能验证实验
以交换机为核心的星型拓扑结构取代弥补型拓扑图缺点,交换机的重要性不言而喻。提示:以下是本篇文章正文内容,下面案例可供参考。
2024-06-03 16:35:17
2469
1
ASSIST2012-2013
2025-07-31
数据结构python数据结构练习题目与源代码
2024-06-05
软件工程期末考试试卷-5套
2024-06-05
软件工程拯救期末考试系列-期末试卷第一套
2024-06-04
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅