自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(252)
  • 收藏
  • 关注

原创 RT-DETR更新汇总贴

RT-DETR使用教程:缝合教程: RT-DETR中的yaml文件详解:labelimg使用教程:

2024-11-11 21:40:38 1045 1

原创 YOLOv11及自研模型更新汇总

群文件2024/11/08日更新。,群文件2024/11/08日更新。

2024-11-08 19:39:26 2851

原创 YOLOv11融合[CVPR2025]DnLUT中的MuLUTUnit模块

论文速览:虽然深度神经网络彻底改变了图像降噪功能,但由于大量的计算和内存要求,它们在边缘设备上的部署仍然具有挑战性。为此,我们提出了 DnLUT,这是一种基于查找表的超高效框架,能够以最少的资源消耗实现高质量的彩色图像去噪。我们的关键创新在于两个互补的组件:有效并行捕获通道间相关性和空间依赖性的成对通道混频器 (PCM),以及新颖的 L 形卷积设计,可最大限度地提高感受野覆盖率,同时最大限度地减少存储开销。

2025-04-05 20:46:58 389

原创 RTDETR融合[CVPR2025]DnLUT中的MuLUTUnit模块

论文速览:虽然深度神经网络彻底改变了图像降噪功能,但由于大量的计算和内存要求,它们在边缘设备上的部署仍然具有挑战性。为此,我们提出了 DnLUT,这是一种基于查找表的超高效框架,能够以最少的资源消耗实现高质量的彩色图像去噪。我们的关键创新在于两个互补的组件:有效并行捕获通道间相关性和空间依赖性的成对通道混频器 (PCM),以及新颖的 L 形卷积设计,可最大限度地提高感受野覆盖率,同时最大限度地减少存储开销。

2025-04-05 20:27:39 414

原创 RTDETR融合[CVPR2025]HVI-CIDNet中的HV_LCA模块

论文速览:低光图像增强 (LLIE) 是一项重要的计算机视觉任务,旨在从损坏的低光图像中恢复详细的视觉信息。许多现有的 LLIE 方法都基于标准 RGB (sRGB) 空间,由于 sRGB 中固有的高颜色敏感度,这通常会产生颜色偏差和亮度伪影。虽然使用色相、饱和度和值 (HSV) 色彩空间转换图像有助于解决亮度问题,但它会引入明显的红色和黑色杂色伪影。为了解决这个问题,我们为 LLIE 提出了一个新的色彩空间,即水平/垂直强度 (HVI),由极化 HS 图和可学习强度定义。

2025-04-01 19:24:17 995

原创 YOLOv11融合[CVPR2025]HVI-CIDNet中的HV_LCA模块

低光图像增强 (LLIE) 是一项重要的计算机视觉任务,旨在从损坏的低光图像中恢复详细的视觉信息。许多现有的 LLIE 方法都基于标准 RGB (sRGB) 空间,由于 sRGB 中固有的高颜色敏感度,这通常会产生颜色偏差和亮度伪影。虽然使用色相、饱和度和值 (HSV) 色彩空间转换图像有助于解决亮度问题,但它会引入明显的红色和黑色杂色伪影。为了解决这个问题,我们为 LLIE 提出了一个新的色彩空间,即水平/垂直强度 (HVI),由极化 HS 图和可学习强度定义。

2025-04-01 19:19:20 1238

原创 YOLOv11融合何凯明[CVPR2025]新作DyT结构

归一化层在现代神经网络中无处不在,长期以来一直被认为是必不可少的。这项工作表明,没有归一化的 Transformers 可以使用一种非常简单的技术实现相同或更好的性能。我们引入了动态 tanh (DyT),这是一种元素运算 DyT(x) = tanh(αx),作为 Transformer 中归一化层的直接替代品。DyT 的灵感来自于以下观察结果:Transformers 中的层归一化通常会产生类似 tanh 的 S 形输入-输出映射。

2025-03-31 20:10:27 938

原创 RTDETR融合何凯明[CVPR2025]新作DyT结构

论文速览:归一化层在现代神经网络中无处不在,长期以来一直被认为是必不可少的。这项工作表明,没有归一化的 Transformers 可以使用一种非常简单的技术实现相同或更好的性能。我们引入了动态 tanh (DyT),这是一种元素运算 DyT(x) = tanh(αx),作为 Transformer 中归一化层的直接替代品。DyT 的灵感来自于以下观察结果:Transformers 中的层归一化通常会产生类似 tanh 的 S 形输入-输出映射。

2025-03-31 20:07:40 1064

原创 [已解决]UserWarning: __floordiv__ is deprecated

解决办法:使用torch.div替换对张量的 // 操作。

2025-03-15 19:29:23 186

原创 RTDETR融合[CVPR2025]ARConv中的自适应矩阵卷积

论文速览:基于卷积神经网络 (CNN) 的遥感全色锐化技术的最新进展显著提高了图像质量。然而,这些方法中的传统卷积模块有两个关键的缺点。首先,卷积运算中的采样位置被限制在一个固定的方形窗口内。其次,采样点的数量是预设的,保持不变。鉴于遥感图像中的物体大小不同,这些刚性参数会导致次优特征提取。为了克服这些限制,我们引入了一个创新的卷积模块,即自适应矩形卷积 (ARConv)。ARConv 自适应地学习卷积核的高度和宽度,并根据学习到的尺度动态调整采样点的数量。

2025-03-14 11:57:09 1523

原创 YOLOv11融合[CVPR2025]ARConv中的自适应矩阵卷积

基于卷积神经网络 (CNN) 的遥感全色锐化技术的最新进展显著提高了图像质量。然而,这些方法中的传统卷积模块有两个关键的缺点。首先,卷积运算中的采样位置被限制在一个固定的方形窗口内。其次,采样点的数量是预设的,保持不变。鉴于遥感图像中的物体大小不同,这些刚性参数会导致次优特征提取。为了克服这些限制,我们引入了一个创新的卷积模块,即自适应矩形卷积 (ARConv)。ARConv 自适应地学习卷积核的高度和宽度,并根据学习到的尺度动态调整采样点的数量。

2025-03-14 11:50:39 1255

原创 RTDETR融合[CVPR2025]SCSegamba中的GBC结构

论文速览:在各种情况下对结构裂缝进行像素级分割仍然是一个相当大的挑战。当前方法在有效模拟裂纹形态和织构方面面临挑战,在平衡分割质量和低计算资源使用率方面面临挑战。为了克服这些限制,我们提出了一种轻量级的结构感知视觉曼巴网络 (SCSegamba),它能够通过利用裂纹像素的形态信息和纹理线索,以最小的计算成本生成高质量的像素级分割图。具体来说,我们开发了一个结构感知视觉状态空间模块(SAVSS),它结合了轻量级门控瓶颈卷积(GBC)和结构感知扫描策略(SASS)。

2025-03-11 20:55:47 928

原创 YOLOv11融合[CVPR2025]SCSegamba中的GBC结构

在各种情况下对结构裂缝进行像素级分割仍然是一个相当大的挑战。当前方法在有效模拟裂纹形态和织构方面面临挑战,在平衡分割质量和低计算资源使用率方面面临挑战。为了克服这些限制,我们提出了一种轻量级的结构感知视觉曼巴网络 (SCSegamba),它能够通过利用裂纹像素的形态信息和纹理线索,以最小的计算成本生成高质量的像素级分割图。具体来说,我们开发了一个结构感知视觉状态空间模块(SAVSS),它结合了轻量级门控瓶颈卷积(GBC)和结构感知扫描策略(SASS)。

2025-03-11 20:29:07 1155

原创 YOLOv11融合YOLOv12中的R-ELAN结构

论文速览:长期以来,增强YOLO框架的网络架构一直至关重要,但一直专注于基于cnn的改进,尽管注意力机制在建模能力方面已被证明具有优越性。这是因为基于注意力的模型无法匹配基于cnn的模型的速度。本文提出了一种以注意力为中心的YOLO框架,即YOLOv12,与之前基于cnn的YOLO框架的速度相匹配,同时利用了注意力机制的性能优势。YOLOv12在精度和速度方面超越了所有流行的实时目标检测器。

2025-03-03 21:35:30 967

原创 RT-DETR融合YOLOv12中的R-ELAN结构

论文速览:长期以来,增强YOLO框架的网络架构一直至关重要,但一直专注于基于cnn的改进,尽管注意力机制在建模能力方面已被证明具有优越性。这是因为基于注意力的模型无法匹配基于cnn的模型的速度。本文提出了一种以注意力为中心的YOLO框架,即YOLOv12,与之前基于cnn的YOLO框架的速度相匹配,同时利用了注意力机制的性能优势。YOLOv12在精度和速度方面超越了所有流行的实时目标检测器。

2025-03-03 21:29:00 1107

原创 关于YOLO与RTDETR群的更新说明

YOLO和RT-DETR改进/融合模块预计更新200个左右,目前两个群聊更新均已过百,进度已过半。今年以来,个人工作和生活压力骤增,思索再三决定自2025年/3/9日起不再接受进群申请,更新计划不变,更完即止。

2025-02-26 16:02:52 218

原创 YOLOv12从入门到入土(含结构图)

作者构建了一个以注意力为核心构建了YOLOv12检测模型,主要创新点创新点如下:1、提出一种简单有效的区域注意力机制(area-attention)。2、提出一种高效的聚合网络结构R-ELAN。"""Methods:Examples:Notes:"""N = H * W# else:return x结构上与YOLOv11里C2PSA中的模式相似,使用了Flash-attn进行运算加速。

2025-02-19 22:04:11 8272 25

原创 YOLOv12译文

今日,中国科学院大学联合Buffalo大学发布YOLOv12,本文为原文译文。模型及模型分析见下篇文章。

2025-02-19 17:44:58 328

原创 YOLOv11融合[AAAI2025]的Mesorch 模型中的高、低频特征提取模块

论文速览:介观层面是宏观世界和微观世界之间的桥梁,解决了两者忽视的差距。图像处理定位 (IML) 是从假图像中寻找真相的关键技术,长期以来一直依赖于低级(微观级)跟踪。然而,在实践中,大多数篡改旨在通过改变图像语义来欺骗观众。因此,作通常发生在对象级别(宏观级别),这与微观跟踪同样重要。因此,将这两个水平整合到介观水平上为 IML 研究提供了新的视角。受此启发,我们的论文探讨了如何同时为 IML 构建微观和宏观信息的介观表示,并介绍了 Mesorch 架构来协调两者。

2025-02-12 20:45:19 1043

原创 RTDETR融合[AAAI2025]的Mesorch 模型中的高、低频特征提取模块

论文速览:介观层面是宏观世界和微观世界之间的桥梁,解决了两者忽视的差距。图像处理定位 (IML) 是从假图像中寻找真相的关键技术,长期以来一直依赖于低级(微观级)跟踪。然而,在实践中,大多数篡改旨在通过改变图像语义来欺骗观众。因此,作通常发生在对象级别(宏观级别),这与微观跟踪同样重要。因此,将这两个水平整合到介观水平上为 IML 研究提供了新的视角。受此启发,我们的论文探讨了如何同时为 IML 构建微观和宏观信息的介观表示,并介绍了 Mesorch 架构来协调两者。

2025-02-12 20:33:33 1090 3

原创 RTDETR融合[AAAI2025]的TBSN中的DilatedMDTA模块

论文速览:盲点网络 (BSN) 是自监督图像降噪 (SSID) 中普遍存在的神经架构。但是,大多数现有的 BSN 都是使用卷积层进行的。尽管 transformer 在许多图像恢复任务中显示出克服卷积限制的潜力,但注意力机制可能会违反盲点要求,从而限制它们在 BSN 中的适用性。为此,我们建议分析和重新设计通道和空间注意力,以满足盲点需求。具体来说,通道自注意力可能会泄露多尺度架构中的盲点信息,因为下采样将空间特征洗牌到通道维度。为了缓解这个问题,我们将频道分成几组,分别进行频道关注。

2025-02-11 19:54:19 712

原创 YOLOv11融合[AAAI2025]的TBSN中的DilatedMDTA模块

论文速览:盲点网络 (BSN) 是自监督图像降噪 (SSID) 中普遍存在的神经架构。但是,大多数现有的 BSN 都是使用卷积层进行的。尽管 transformer 在许多图像恢复任务中显示出克服卷积限制的潜力,但注意力机制可能会违反盲点要求,从而限制它们在 BSN 中的适用性。为此,我们建议分析和重新设计通道和空间注意力,以满足盲点需求。具体来说,通道自注意力可能会泄露多尺度架构中的盲点信息,因为下采样将空间特征洗牌到通道维度。为了缓解这个问题,我们将频道分成几组,分别进行频道关注。

2025-02-11 19:36:50 1097

原创 RTDETR融合[WACV 2024]的MetaSeg中的gmb模块

论文速览:除了 Transformer 之外,探索如何利用 MetaFormer 的能力也很重要,MetaFormer 是一种架构,是 Transformer 性能改进的基础。以前的研究仅将其用于骨干网络。与以前的研究不同,我们在语义分割任务中更广泛地探索了 Metaformer 架构的能力。我们提出了一个强大的语义分割网络 MetaSeg,它利用了从主干到解码器的 Metaformer 架构。我们的 MetaSeg 表明,MetaFormer 架构在捕获解码器和主干的有用上下文方面发挥着重要作用。

2025-01-13 20:17:28 1390

原创 YOLOv11融合[WACV 2024]的MetaSeg中的gmb模块

论文速览:除了 Transformer 之外,探索如何利用 MetaFormer 的能力也很重要,MetaFormer 是一种架构,是 Transformer 性能改进的基础。以前的研究仅将其用于骨干网络。与以前的研究不同,我们在语义分割任务中更广泛地探索了 Metaformer 架构的能力。我们提出了一个强大的语义分割网络 MetaSeg,它利用了从主干到解码器的 Metaformer 架构。我们的 MetaSeg 表明,MetaFormer 架构在捕获解码器和主干的有用上下文方面发挥着重要作用。

2025-01-13 20:12:30 967

原创 YOLOv11融合[AAAI2025]的ConSeg中的CDFAPreprocess模块

论文速览:医学图像分割在临床决策、治疗计划、疾病跟踪等方面发挥着重要作用。然而,它仍面临两大挑战。一方面,医学图像的前景和背景之间往往存在“软边界”,较差的照度和较低的对比度进一步降低了图像内前景和背景的可分辨性。另一方面,医学图像中普遍存在共现现象,学习这些特征会对模型的判断产生误导。为了解决这些挑战,我们提出了一个称为对比度驱动医学图像分割(ConDSeg)的通用框架。首先,我们开发了一种称为一致性强化的对比训练策略。

2025-01-11 19:36:45 978

原创 RT-DETR融合[AAAI2025]的ConSeg中的CDFAPreprocess模块

论文速览:医学图像分割在临床决策、治疗计划、疾病跟踪等方面发挥着重要作用。然而,它仍面临两大挑战。一方面,医学图像的前景和背景之间往往存在“软边界”,较差的照度和较低的对比度进一步降低了图像内前景和背景的可分辨性。另一方面,医学图像中普遍存在共现现象,学习这些特征会对模型的判断产生误导。为了解决这些挑战,我们提出了一个称为对比度驱动医学图像分割(ConDSeg)的通用框架。首先,我们开发了一种称为一致性强化的对比训练策略。

2025-01-11 19:36:12 1114

原创 YOLOv11融合[AAAI2025]的ConSeg中的模块

论文速览:医学图像分割在临床决策、治疗计划、疾病跟踪等方面发挥着重要作用。然而,它仍面临两大挑战。一方面,医学图像的前景和背景之间往往存在“软边界”,较差的照度和较低的对比度进一步降低了图像内前景和背景的可分辨性。另一方面,医学图像中普遍存在共现现象,学习这些特征会对模型的判断产生误导。为了解决这些挑战,我们提出了一个称为对比度驱动医学图像分割(ConDSeg)的通用框架。首先,我们开发了一种称为一致性强化的对比训练策略。

2025-01-10 19:43:30 1074

原创 RT-DETR融合[AAAI2025]的ConSeg中的模块

论文速览:医学图像分割在临床决策、治疗计划、疾病跟踪等方面发挥着重要作用。然而,它仍面临两大挑战。一方面,医学图像的前景和背景之间往往存在“软边界”,较差的照度和较低的对比度进一步降低了图像内前景和背景的可分辨性。另一方面,医学图像中普遍存在共现现象,学习这些特征会对模型的判断产生误导。为了解决这些挑战,我们提出了一个称为对比度驱动医学图像分割(ConDSeg)的通用框架。首先,我们开发了一种称为一致性强化的对比训练策略。

2025-01-10 19:40:20 1324

原创 RT-DETR融合YOLOv9的下采样模块ADown

论文速览:当今的深度学习方法侧重于如何设计最合适的目标函数,以便模型的预测结果最接近真实情况。同时,必须设计一个适当的架构,以便于获取足够的信息进行预测。现有方法忽略了一个事实,即当输入数据进行逐层特征提取和空间变换时,会丢失大量信息。本文将深入探讨数据通过深度网络传输时数据丢失的重要问题,即信息瓶颈和可逆功能。我们提出了可编程梯度信息 (PGI) 的概念,以应对深度网络实现多个目标所需的各种变化。PGI 可以为目标任务提供完整的输入信息来计算目标函数,从而获得可靠的梯度信息来更新网络权重。

2025-01-09 19:31:10 1296 2

原创 YOLOv11融合YOLOv9的下采样模块ADown

论文速览:当今的深度学习方法侧重于如何设计最合适的目标函数,以便模型的预测结果最接近真实情况。同时,必须设计一个适当的架构,以便于获取足够的信息进行预测。现有方法忽略了一个事实,即当输入数据进行逐层特征提取和空间变换时,会丢失大量信息。本文将深入探讨数据通过深度网络传输时数据丢失的重要问题,即信息瓶颈和可逆功能。我们提出了可编程梯度信息 (PGI) 的概念,以应对深度网络实现多个目标所需的各种变化。PGI 可以为目标任务提供完整的输入信息来计算目标函数,从而获得可靠的梯度信息来更新网络权重。

2025-01-09 19:29:21 968

原创 RT-DETR融合[CVPR2022]的MDHTA多头自注意力机制

论文速览:由于卷积神经网络 (CNN) 在从大规模数据中学习可泛化图像先验方面表现良好,因此这些模型已广泛应用于图像恢复和相关任务。最近,另一类神经架构 Transformer 在自然语言和高级视觉任务上显示出显著的性能提升。虽然 Transformer 模型减轻了 CNN 的缺点(即感受野有限和对输入内容不适应),但其计算复杂性随空间分辨率的二次方增长,因此无法应用于大多数涉及高分辨率图像的图像恢复任务。

2025-01-08 19:25:47 1210

原创 YOLOv11融合[CVPR2022]的MDHTA多头自注意力机制

论文速览:由于卷积神经网络 (CNN) 在从大规模数据中学习可泛化图像先验方面表现良好,因此这些模型已广泛应用于图像恢复和相关任务。最近,另一类神经架构 Transformer 在自然语言和高级视觉任务上显示出显著的性能提升。虽然 Transformer 模型减轻了 CNN 的缺点(即感受野有限和对输入内容不适应),但其计算复杂性随空间分辨率的二次方增长,因此无法应用于大多数涉及高分辨率图像的图像恢复任务。

2025-01-08 19:22:34 909

原创 YOLOv11融合渐进型金字塔AFPN结构

论文速览:在目标检测任务中,多尺度特征在对具有尺度方差的目标进行编码时具有重要意义。多尺度特征提取的一种常见策略是采用经典的自上而下和自下而上的特征金字塔网络。然而,这些方法存在特征信息的丢失或退化,从而损害了非相邻级别的融合效果。本文提出了一种渐近特征金字塔网络 (AFPN) 来支持非相邻级别的直接交互。AFPN 是通过融合两个相邻的低级特征来启动的,并渐近地将更高级特征合并到融合过程中。这样,可以避免非相邻级别之间较大的语义差距。

2025-01-07 20:57:25 1364

原创 RTDETR融合渐进型金字塔AFPN结构

论文速览:在目标检测任务中,多尺度特征在对具有尺度方差的目标进行编码时具有重要意义。多尺度特征提取的一种常见策略是采用经典的自上而下和自下而上的特征金字塔网络。然而,这些方法存在特征信息的丢失或退化,从而损害了非相邻级别的融合效果。本文提出了一种渐近特征金字塔网络 (AFPN) 来支持非相邻级别的直接交互。AFPN 是通过融合两个相邻的低级特征来启动的,并渐近地将更高级特征合并到融合过程中。这样,可以避免非相邻级别之间较大的语义差距。

2025-01-07 20:56:49 1377

原创 YOLOv11融合[CVPR2020]EfficientDet中的BiFPN结构

论文速览:模型效率在计算机视觉中变得越来越重要。在本文中,我们系统地研究了对象检测的神经网络架构设计选择,并提出了几个关键优化以提高效率。首先,我们提出了一种加权双向特征金字塔网络 (BiFPN),它允许简单快速的多尺度特征融合;其次,我们提出了一种复合缩放方法,可以同时统一缩放所有主干、特征网络和盒/类预测网络的分辨率、深度和宽度。基于这些优化和更好的主干网络,我们开发了一个新的对象检测器系列,称为 EfficientDet,它在广泛的资源限制下始终实现比现有技术高得多的效率。

2025-01-06 19:09:07 1486

原创 RT-DETR融合[CVPR2020]EfficientDet中的BiFPN结构

论文速览:模型效率在计算机视觉中变得越来越重要。在本文中,我们系统地研究了对象检测的神经网络架构设计选择,并提出了几个关键优化以提高效率。首先,我们提出了一种加权双向特征金字塔网络 (BiFPN),它允许简单快速的多尺度特征融合;其次,我们提出了一种复合缩放方法,可以同时统一缩放所有主干、特征网络和盒/类预测网络的分辨率、深度和宽度。基于这些优化和更好的主干网络,我们开发了一个新的对象检测器系列,称为 EfficientDet,它在广泛的资源限制下始终实现比现有技术高得多的效率。

2025-01-06 19:08:18 894

原创 YOLOv11融合[ECCV2024]SFHformer中的模块

论文速览:自然图像可能会因恶劣的大气条件或独特的退化机制而出现各种退化现象。这种多样性使得为各种恢复任务设计一个通用框架具有挑战性。现有的图像恢复方法不是探索不同退化现象的共性,而是专注于在有限的恢复先验下对网络架构的修改。在这项工作中,我们首先从频率角度回顾了各种退化现象。基于此,我们提出了一个高效的图像恢复框架,称为 SFHformer,它将快速傅里叶变换机制整合到 Transformer 架构中。

2024-12-29 10:26:50 1030

原创 RT-DETR融合[ECCV2024]SFHformer中的模块

论文速览:自然图像可能会因恶劣的大气条件或独特的退化机制而出现各种退化现象。这种多样性使得为各种恢复任务设计一个通用框架具有挑战性。现有的图像恢复方法不是探索不同退化现象的共性,而是专注于在有限的恢复先验下对网络架构的修改。在这项工作中,我们首先从频率角度回顾了各种退化现象。基于此,我们提出了一个高效的图像恢复框架,称为 SFHformer,它将快速傅里叶变换机制整合到 Transformer 架构中。

2024-12-29 10:15:34 1189

原创 RT-DETR融合[IJCV2024]LSKNet中的LSKBlock模块

论文速览:关于遥感对象检测的研究主要集中在改进定向边界框的表示上,但忽视了遥感场景中提供的独特先验知识。这种先验知识可能很有用,因为微小的遥感物体可能会在没有参考足够长程的背景的情况下被错误地检测到,并且不同类型的物体所需的长程背景可能会有所不同。在本文中,我们考虑了这些先验,并提出了大核选择性网络 (LSKNet)。LSKNet 可以动态调整其较大的空间感受野,以更好地模拟遥感场景中各种目标的测距环境。总结:作者提出一种大核选择性网络,本文利用其中的LSKBlock与常见模块进行融合。​⭐⭐。

2024-12-27 22:20:20 1233

原创 YOLOv11融合[IJCV2024]LSKNet中的LSKBlock模块

论文速览:关于遥感对象检测的研究主要集中在改进定向边界框的表示上,但忽视了遥感场景中提供的独特先验知识。这种先验知识可能很有用,因为微小的遥感物体可能会在没有参考足够长程的背景的情况下被错误地检测到,并且不同类型的物体所需的长程背景可能会有所不同。在本文中,我们考虑了这些先验,并提出了大型选择性核网络 (LSKNet)。LSKNet 可以动态调整其较大的空间感受野,以更好地模拟遥感场景中各种目标的测距环境。总结:作者提出一种大核选择性网络,本文利用其中的LSKBlock与常见模块进行融合。​⭐⭐。

2024-12-27 21:54:25 1473

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除