自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(27)
  • 收藏
  • 关注

原创 RGB-D综述

RGB-D显著性检测已成为计算机视觉领域的研究热点,结合RGB与深度信息的互补性,能够有效提升复杂环境下的显著性检测能力。RGB-D显著性检测的目标是利用RGB(可见光)与D(深度)信息的互补性,提高在复杂环境中的目标检测能力。与单模态RGB显著性检测相比,RGB-D方法能够提供额外的场景结构信息,有助于分离前景和背景,在遮挡、低对比度等情况下表现更优。以下是对RGB-D显著性检测的综述性梳理,包括研究背景、挑战、方法分类、关键技术、数据集、评测指标及未来研究方向。代表方法:CPFP(基于全局-局部建模)

2025-03-27 21:22:14 907

原创 RGB-T综述

RGB-T显著性检测已成为计算机视觉研究的重要方向,结合RGB与热红外数据的互补性,能够提升复杂环境下的显著性检测能力。当前研究重点包括跨模态特征融合、Transformer应用、自监督学习等。未来的发展将集中在更高效的模型设计、弱监督学习以及多模态融合,以进一步提升模型的实用性和鲁棒性。

2025-03-27 21:19:15 498

原创 CIR-Net:用于 RGB-D 显著性目标检测的跨模态交互与优化(问题)

图3.所提出的CIR-Net的概览图。从主干网络中提取的RGB特征和深度特征分别表示为,其中r和d分别代表RGB分支和深度分支,表示特征层级的索引。在特征编码器中,我们还使用渐进式注意力引导融合(PAI)单元来生成跨模态的RGB-D编码器特征。然后,将顶层的RGB、深度和RGB-D特征嵌入到由自模态注意力优化(smAR)单元和跨模态加权优化(cmWR)单元组成的优化中间件中,以自模态和跨模态的方式逐步优化多模态编码器特征。

2025-03-20 21:25:40 745

原创 用于 RGB-D 显著目标检测的点感知交互和 CNN 诱导的细化网络(问题)

问题一:现有的RGB-D显著性目标检测(SOD)方法可分为三类:纯卷积神经网络(CNNs)模型、纯Transformer模型以及Transformer辅助的CNNs模型。?1. 纯 CNN 模型传统的 RGB-D SOD 方法主要基于卷积神经网络(CNN),通过级联、多尺度特征提取、注意力机制等方式来融合 RGB 和深度信息。(1)依赖 CNN 的局部感知能力和平移不变性,对细节和边缘信息较敏感。(2)采用多尺度特征融合。

2025-03-19 18:59:51 977 3

原创 CIR-Net:用于 RGB-D 显著性目标检测的跨模态交互与优化

当观看一幅图像时,人们会不由自主地被图像中的某些物体或区域所吸引(例如,图1中第二张图像里的蓝精灵),这主要是由人类的视觉注意力机制所导致的,而这些物体被称为显著目标[1]–[3]。在计算机视觉领域中,模拟这种机制,显著目标检测(SOD)是一项自动定位场景中最具视觉吸引力的物体或区域的任务,它已成功应用于众多任务中,如分割[4]–[9]、检索[10]、增强[11]–[15]以及质量评估[16], [17]。图1.不同方法的可视化示例。(a) RGB图像。(b) 深度图。(c) 真实标签。(d) 我们的结果。

2025-03-19 11:12:59 808

原创 显著性检测分类(数据集和评估指标总结)

三:RGB-T显著性检测 (RGB-T SOD)

2025-03-17 20:30:09 689

原创 分而治之:用于 RGB-T 显著目标检测的 Confluent Triple-Flow 网络(问题)

问题一:解释一下这张图?​(a) 单流架构(Single-flow)​​结构特点​输入:RGB和Thermal图像直接拼接(或早期融合)。​编码器-解码器:共享同一主干网络提取特征,仅通过单一路径处理双模态数据。​融合方式:浅层或末端简单融合(如通道拼接或相加)。​代表方法:MIA [1]。​优点计算量低,适合资源受限场景。在强噪声场景下表现较好(噪声被双模态平均抑制)。​缺点模态差异被忽略,导致特征冲突(如RGB纹理与Thermal温度分布不匹配)。

2025-03-14 09:32:38 658

原创 用于 RGB-D 显著目标检测的点感知交互和 CNN 诱导的细化网络

受人类视觉系统的启发,显著性目标检测(SOD)旨在定位给定场景中最具吸引力的目标或区域[3, 5, 6, 9-13, 27, 54, 59],该技术已成功应用于众多任务中。此外,RGB-D显著性目标检测任务在显著性目标检测任务中额外引入了深度图,以便更好地模拟人类双目视觉系统的能力,并获得感知物体间距离关系的能力。

2025-03-13 14:50:05 778

原创 分而治之:用于 RGB-T 显著目标检测的 Confluent Triple-Flow 网络

显著性目标检测(Saliency Object Detection,简称 SOD)是众多领域(如计算机视觉、计算机图形学和机器人学)中的一项基础研究任务,其目标是在图像中精确定位那些能够吸引人类视觉注意力的像素级目标或区域。近年来,显著性目标检测已成功应用于众多下游领域 [3]、[4]、[5]、[6]。特别是在基于 RGB 的显著性目标检测任务中 [7]、[8],已经取得了重大进展。然而,尽管 RGB 模态提供了丰富的纹理和颜色信息,但它缺乏鲁棒性,并且很容易受到实际环境因素的影响。

2025-03-10 21:26:40 1225

原创 论文总结点

这篇论文通过引入。

2025-03-10 16:08:43 892

原创 关于协同显著性物体检测的思考

对于 N 张关联图像,协同显著性检测旨在分割共同前景物体并生成协同显著图。为此,本文提出二分支检测框架,分别独立捕获共同依赖与显著前景,顶部分支输出协同注意图,底部分支输出显著图,二者逐元素相乘得到最终协同显著性预测。获取显著性先验图时,本文利用在 DUTS 数据集训练的 EGNet 模型,通过边缘导向方法获取多尺度显著性先验。而以无监督方式生成协同注意图是接下来要解决的挑战。

2025-02-20 21:14:25 696

原创 探索显著性检测中语义信息的高效模型

问题一:什么叫做CSNet?CSNet是一种专注于通道和空间特征的神经网络架构,旨在通过同时优化通道维度和空间维度的特征表示,提升模型在计算机视觉任务(如图像分类、目标检测、语义分割等)中的性能。CSNet 的核心思想是通过通道注意力机制和空间注意力机制来增强特征提取能力。核心思想通道维度优化:通过通道注意力机制(Channel Attention)动态调整每个通道的权重,增强重要通道的特征表示。例如,使用模块来学习通道间的依赖关系。空间维度优化。

2025-02-20 21:12:15 864

原创 EDN:通过极致下采样网络的显著性物体检测

问题一:VGG16的模块是什么?VGG16是一种经典的卷积神经网络(CNN)架构,由提出的,主要用于图像分类任务。VGG16 的核心特征是它采用了非常简单而统一的网络结构,主要由一系列卷积层池化层和全连接层构成。其名称中的“16”表示该网络包含了 16 层可训练参数。1. 卷积层(Convolutional Layers)VGG16 中的卷积层非常简单,每个卷积层使用3x3 的卷积核,并且步幅(stride)为 1。

2025-02-20 21:05:01 1113

原创 基于正则化密集连接金字塔网络的显著实例分割

问题一: 什么叫做显著实例分割(SIS)?显著实例分割(SIS, Salient Instance Segmentation)是一种结合了显著性检测(Salient Object Detection)和实例分割(Instance Segmentation)的任务,目标是从图像中分割出最重要或最显著的物体实例。问题二:什么叫做Mask R-CNN?Mask R-CNN是一种深度学习模型,专门用于**实例分割(Instance Segmentation)**任务。它基于目标检测框架。

2025-02-19 15:12:20 833

原创 MobileSal:极其高效的RGB-D显著性物体检测模型

问题1:什么叫做深度信息?深度信息(Depth Information):是指图像中每个像素到观察者(或摄像头)之间的距离。深度图像通常通过深度摄像头(如Kinect、LiDAR等)采集,能够提供关于场景中物体相对位置和空间关系的信息。问题二:什么叫做MobileNets网络和ShuffleNets?MobileNets是由 Google 提出的一个轻量级卷积神经网络架构,专门优化了在移动设备上的计算效率。MobileNets 的关键创新是使用深度可分离卷积。

2025-02-18 17:02:29 907

原创 操作系统大题整理

宏内核:宏内核是将操作系统的主要功能模块都集中在内核的一种结构。高性能,复杂度高,缺乏灵活性。具体表现在:由于所有的功能都在内核中,模块之间的调用通过函数调用实现,通信开销小,执行效率高。内核代码庞大且复杂,因为包含了众多功能模块,使得内核的开发,维护和调试都比较困难。微内核:微内核只把操作系统最基本的功能放在内核中,其他功能如文件系统,设备管理等都放在内核之外的空间。高可靠性,良好的拓展性。内核小简单,减少了内核出错的概率,如果用户空间的服务出现故障,不会直接导致整个系统崩溃。

2025-01-05 13:36:23 1494 9

原创 机器学习复习题

CART(Classification And Regression Tree)决策树是一种基于二叉树结构的分类或回归算法。在分类任务中,CART决策树使用**基尼系数(Gini Index)**作为划分节点的准则。支持向量机(SVM)的核心是找到一个决策边界(超平面)来最大化分类间隔。主成分分析(PCA)是一种常用的降维技术,用于将高维数据映射到低维空间,同时尽可能保留数据的方差。集成学习的泛化能力(即在未见数据上的表现)直接决定了模型的实用性。减少复杂度过高的基学习器。集成学习的核心思想是。

2025-01-02 16:35:30 1480 2

原创 算法(大题)

第一题第二题第三题第四题第五题第六题第七题第八题第九题

2024-12-30 14:22:50 573

原创 高等工程数学复习题(为天地立心,为生民立命)

计算题第一题第二题第三题第四题第五题第六题

2024-12-26 12:05:50 442

原创 基于协同表达纯化的协同显著性物体检测(问题)

问题1:什么叫做协同显著性物体检测?协同显著性物体检测(Co-SOD)是一项计算机视觉任务,旨在从一组相关图像中检测并分割出所有图像中共同显著的物体。与单一图像的显著性物体检测(Salient Object Detection, SOD)不同,Co-SOD关注的是多张图像中共享的显著性目标。问题二:什么叫做挖掘协同表示对于定位协同显著性至关重要?在协同显著性物体检测(Co-SOD)任务中,要成功检测并定位一组相关图像中的共同显著性物体,核心问题是如何有效提取并表示图像组中的共性特征(协同表示)。

2024-12-24 18:07:16 1086

原创 计算机视觉(为天地立心,为生民立命)

2.实际例子。

2024-12-15 09:49:29 1358

原创 显著性目标检测:一项调查(总结)

本文是一篇关于显著目标检测的研究综述。显著目标检测是指在自然场景中检测和分割出显著物体的任务,在计算机视觉领域引起了广泛的关注。虽然已经有许多模型被提出并应用于实际应用中,但是对于该领域的深入了解仍然不足。因此,本文旨在全面回顾最近在显著目标检测方面的进展,并将其置于与其他相关领域(如通用场景分割、对象提议生成和注视预测中的显著性)的关系中进行讨论。文章涵盖了228篇文献,包括显著目标检测的起源、关键概念和任务、核心技术和主要建模趋势以及数据集和评估指标等方面的内容。

2024-12-12 09:04:25 1136

原创 显著性目标检测:一项调查

人类能够在预注意阶段轻松快速地检测到视觉上独特的(所谓的显着)场景区域。然后,在专注阶段,这些过滤后的区域会被更精细地感知和处理,以提取更丰富的高级信息。认知科学家对这一能力已研究许久,而近来它在计算机视觉领域也引起了诸多关注,主要是因为它有助于找出能够有效表征场景的物体或区域,这在诸如场景理解等复杂的视觉问题中是很有用的一个步骤。

2024-12-09 15:26:19 2008

原创 显著性物体检测:一个基准

摘要——我们广泛地比较了7个具有挑战性的数据集上的41种最先进的模型(包括29种显著对象检测,10种注视预测,1种物体性以及1种基线),以基准测试显著对象检测和分割方法。从迄今为止的结果来看,在准确性方面取得了快速的进展,并且运行时间也得到了改善。在本基准中表现最佳的模型明显优于三年前基准测试中识别出的最佳模型。我们发现专门设计用于显著对象检测的模型通常比相关领域的模型工作得更好,这反过来为这个问题提供了一个精确的定义并建议了一种适当的治疗方法,使其与其他问题区分开来。

2024-12-06 15:03:52 1264

原创 通过直方图转换器恢复恶劣天气条件下的图像

计算机视觉领域对恢复受雨、雾和雪等恶劣天气条件影响的图像越来越感兴趣。这些天气条件会显著降低视觉质量,影响下游任务的性能,如目标检测[3,60]和深度估计[16,18]。因此,在恶劣天气下图像的恢复是一个至关重要的问题,为了视觉美学和安全。早期的研究利用天气相关的先验来模拟退化的统计特征,并去除不利天气[1,2,22,23,35,76,83,95,99]。

2024-12-02 17:59:59 1378

原创 以数据为中心的视觉变压器非均匀除雾解决方案

近年来,人们对图像去雾的兴趣越来越大。人们提出了许多深度学习方法来解决这一挑战,并在处理均匀雾霾方面取得了重大成就。然而,当这些解决方案应用于具有非均匀雾霾的图像时,例如由NTIRE挑战引入的NH-HAZE23数据集,这些解决方案无法保持可比的性能。这种失败的原因之一是,非均匀雾霾不符合均匀雾霾建模所需的假设之一。此外,传统的端到端训练方法需要大量对非均匀的模糊图像和干净的对应图像,而NH-HAZE23数据集数量有限。

2024-11-26 20:54:59 915

原创 少样本学习的综合调查:进化、应用、挑战和机遇

最近硬件和信息技术的进步加速了各种物联网应用领域中数十亿设备的互联。智能和自适应设备越来越多地部署在关键基础设施中,如卫生、交通、工业生产、环境检测、家庭自动化以及许多其他证明万物互联(IoE)框架的基础设施中。这些数量庞大的终端设备产生了大量的数据,这些数据需要发送回服务器进行中央处理和存储。虽然在边缘生成的数据总量非常大,但单个设备或单个场景生成的每个数据集的体积非常有限,样本非常少。传统的数据驱动和单域算法在这些设置中表现不佳。为此,人们进行了大量的研究,探索基于少样本和跨域场景的有效学习方法。

2024-11-25 15:24:54 585 1

基于协同表达纯化的协同显著性物体检测

基于协同表达纯化的协同显著性物体检测

2024-12-17

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除