自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(162)
  • 收藏
  • 关注

原创 yolo训练结果

缺点:忘记关闭早停机制—好像也忘记记载模块了—第50轮后直线下降。缺点:忘记设置白名单—第50轮停了—好像也忘记记载模块了。V8修改卷积BIformer注意力机制100轮。V8修改卷积BIformer注意力机制50轮。V8修改卷积ODCOnv 50轮。数据集Fer2013。数据集Fer2013。数据集Fer2013。

2025-09-19 11:28:31 246

原创 EMCAD:E

即可达到与 SwinIR(当时的 SOTA 模型)相当的性能,同时实现 “更高 PSNR(图像质量指标)+ 更少参数量 / 计算量” 的平衡。门控空间注意力单元(GSAU):融**合门控机制与局部注意力,**移除冗余信息、避免伪影;使用**LGAG大核分组注意力门,MSCAM多尺度卷积注意力,**集成。1、EMCAD 解码器模块 | 作为核心单元,多尺度大核注意力(MLKA):在。3、MSCAM高效多尺度卷积,3、LGAG,大核分组注意力门。核心:基础功能单元,负责。捕获丰富的注意力信息;

2025-12-26 14:34:41 207

原创 LDconv

LDConv 的核心创新是将 “参数增长模式从平方转为线性性”,同时支持任意采样形状,既解决了大核卷积的参数负担,又能动态适配不同目标的形状,是提升 CNN 性能的 “轻量、即插即用” 模块。部署友好性:参数数量随卷积核大小线性增长(传统卷积为平方增长),适配硬件环境的资源限制,可作为轻量化模型的替代方案,减少参数与计算过载。实现 “非规则卷积核提取特征” 的功能,提供了任意形状 / 大小的卷积核,弥补传统卷积的局限;调整卷积核的采样位置以适配目标变化,同时探索了三种提取非规则卷积核特征的方法;

2025-12-26 14:32:36 299

原创 HFFB——七、Hifuse模型

1、优势:使用窗口多头自注意力模块,与标准的相比,WMSA将特征图划分为M*M的非重叠窗口,仅在每个窗口内的计算自注意力,目的答复降低计算难度。3、 多尺度的特征耦合,继承CNN局部和Transfor全局的结构有点,实现了能在不同的网络深度上去进行局部与全局的特征的紧密耦合。2、分层的特征融合块,专门设计的模块,用于高效的去融合来自不同层次和分支特征,且保持分支的特征的独立性。3、融合与输出,分层特征融合块,在HHF块,融合该阶段去提取的局部特征与全局表示,链接前一段的输出,

2025-12-10 16:24:15 494

原创 SCSAyolo

这部分内容详细说明了 SCSA 的 “如何实现”—— 通过 SMSA 完成空间语义的多尺度提取,再通过 PCSA 完成通道语义的高效整合,最终实现 “轻量化 + 多语义优化” 的注意力机制,为后续实验中的性能提升提供了技术支撑。逻辑,针对每个子特征,使用摸不同尺度的深度课分离1D卷积,,分别用高,宽吗,两个维度的去提取空间结构信息。传统注意力SMSA,吧语义层级拆开,不同含义的层级,用轻量化的卷积吧每块的语义提取出来,1、对输入特征进行,宽,高,两个信息做平均池化,生成两个1D的序列特征。

2025-12-10 13:58:01 330

原创 《SCSA

5、层面:填补了 “空间与通道注意力协同关系” 的研究空白,通过多语义信息引导和差异缓解,提升了模型在复杂场景下的泛化能力;3、渐进式通道自注意力:利用使用单头自注意力缓解多语义的信息的差异,同时整合空间的先验,引导通道的特征学习。2、渐进式通道自注意力,利用输入感知子注意力细化通道的特征,环节不同自特征之间的语义差距。4、实现了空间知道通道,通道反哺空间,的协同效应,平衡计算效率和识别能力。1、使用空间通道协同关系,提出空间与通道协同注意力模块,空间与通道协同的注意力,七、SCSA 模块架构。

2025-12-03 11:10:35 165

原创 频域感知特征融合(FreqFusion)

浅层特征保留了原始图像的高频信息(如边缘、纹理),AHPF 会为每个深层特征像素预测一个 “专属高通滤波器”,从浅层特征中提取对应的高频细节。4、测结果(Prediction):传统融合的预测边界模糊(如公交车窗户边缘),FreqFusion 的边界更清晰、细节更精准。二者结合,实现了 “语义信息(深层)+ 细节信息(浅层)” 的高效融合,既保证分类准确性,又提升像素级定位精度。例如:物体内部区域的滤波器更 “平滑”(过滤高频噪声),边界区域的滤波器更 “温和”(避免模糊细节)。

2025-12-01 17:20:04 298

原创 EfficientDet 论文核心

5、加权融合:给不同特征分配 “学习权重”—— 比如识别小虫子时,低层细节特征权重高,高层全局特征权重低,模型自己学会 “哪个特征更重要”,而不是一刀切。3、双向传递:不仅 “高层→低层” 传全局信息,还让 “低层→高层” 传细节信息,像双向车道一样互通,避免小目标特征丢失;4、删除冗余节点:去掉只有一个输入的 “无效节点”(比如只有一种食材就没必要 “融合”),让计算更高效;特征融合:BiFPN 接收骨干网络的 5 个尺度特征(P3-P7),重复融合后输出增强特征;2、BiFPN 的三个优化(通俗类比)

2025-12-01 17:06:49 275

原创 KANConv

传统 MLP 在 “节点” 使用固定激活函数,而 KAN 在 “网络边” 使用可学习激活函数(关键创新),实现从 “静态节点函数” 到 “动态边函数” 的转变,模型更灵活。3、核心优势:相比其他架构,KAN 卷积层所需参数显著减少,且能通过 B 样条函数 “平滑表示任意激活函数”,这是 ReLU 等固定激活函数无法实现的。卷积 KAN 的核心创新是用 “可学习样条函数构成的卷积核” 替代 “固定权重卷积核”,既保留了 CNN 的空间特征提取能力,又继承了 KAN“参数少。

2025-11-30 19:13:25 202

原创 BiFPN

2、多尺度表示:自下而上的融合路径,后续也有改进融合结构,但是特征权重处理不好,融合效果不好。5、加权特征融合:BIFPN为每个输入特征的学习权重,去实现自适应加权融合,提升融合效果。1、加权双向特征金字塔:改进传统的特征金字塔,支持高下哦的多尺度的特征融合,3、增加原始输入–到输出节点的额外线路,强化跨尺度的信息流动,2、复合缩放方法:同时缩放网络,特征金字塔,检测头分辨率。4、重复双向路径,多次融合,提升特征的交互效果。1、单阶段检测器:简洁的设计,更高的精度,2、移除仅仅一个输入的节点,

2025-11-29 21:17:14 197

原创 FASFFhead

2、统一分辨率:对不同的输入尺度,使用上下采样变的统一/如 ASFF-L0 对应 P3 尺度,将 P4、P5 上采样到 P3 的分辨率)。3、单阶段检测使用不同层级的特征去检测不同尺寸的目标,(低层→小目标、高层→大目标),1、再单阶段检测中,特征金字塔的不同层对应不同的尺度—(低层→小目标、高层→大目标);1、层次对齐,特征金字塔的不同层级,先将其他层级的特征上下参,和当前层级额分辨率一致。2、空间加权融合,对齐后的三个尺度特征,学习三个空间权重,最后挨个加权融合。上下采样后空间对齐误差大。

2025-11-29 13:15:22 335

原创 AFPN4head

2、多尺度注意力引到,讲动态纹理注意力与AFPN结合,对底层特征的小目标区域进行强化,对高层特征小目标残差进行加权保留。1、空间实力双维度融合:再AFPN中自适应融合模块,加入掩码,对每个目标的特征区域单独划分权重,避免重叠区域信息干扰。1、层级语义补全模块,引入小目标生成器,利用大目标特征,通过生成模式去补全小目标缺失部分,后进行渐进融合。先融合相邻低层特征,再逐步将高层特征纳入融合过程,缩小非相邻层级间的语义差距,实现非相邻层的直接交互。2、动态层级剪裁:根据该区域的目标密度,自动建材特征的参与比例,

2025-11-28 16:13:46 213

原创 CBAM模块

2、作用:让模块学习不同通道的特征的重要性((例如:某些通道对应 “边缘”,某些对应 “纹理”)–有的通道更重要就会分更大的权重。3、与空间注意力关系:通道注意力先筛选出关键特征维度,空间注意力筛选关键区域,二者顺序执行,实现特征的精准细化。4、创新点:将注意力分解为通道和空间两个维度,既避免了 3D 注意力的高计算成本,又实现了更精准的特征细化。1、将通过通道注意力模块加权后的特征图F,再通道维度分别做最大池化和平均池化,得到H。2、空间注意力:通道维度的最大池化+平均池化+卷积层,生成空间权重。

2025-11-28 11:45:45 279

原创 Triplet_Attention

二、特色:Triplet Attention 的跨维度交互是通过三分支旋转 + 残差变换。2、输入张量进行旋转+残差。编码通道和空间信息,一、Triplet Attention 机制。1、三分支结构捕获张量跨度维度关系。三、轻量化–用旋转操作代替卷积操作。做三个不同的旋转动作。

2025-11-25 15:05:28 136

原创 KANConv

传统多层感知机(MLP)的逻辑是 “线性权重矩阵 + 固定激活函数(如 ReLU)”:权重矩阵负责特征间的线性组合,激活函数在节点上做固定的非线性变换。而 KANs 的创新在于:把 “固定激活函数” 替换成 “可学习的样条函数”,且将这种非线性变换从 “节点” 转移到了 “网络边”。1、KANs是基于KA定理,将传统的MLP线性的权重矩阵替换为可学习样条的函数,目的是降低参数量,提升模型的泛化能力。1、将激活函数整合到卷积层中,去将传统的卷积核替换为可学习的非线性的函数。

2025-11-23 12:58:21 164

原创 CGNet

轻量级小模型(如 ESPNet、ENet)仅模仿图像分类的设计思路,忽略了语义分割 “依赖空间上下文、需要捕捉全局 - 局部特征关联” 的固有特性,导致准确率低。1、学习 “局部特征” 与 “周围上下文” 的联合表示,同时捕捉全局上下文信息;CG模块,再所有阶段,从浅到深的语义层、从细到粗的空间层)上下文信息捕获,更全面。1、下采样精简,仅仅设置三个下采样,这样可以降低下采样丢失的数据量,核心:提出CG模块,实现局部特征+上下文+全局语义,降低计算量。五、核心作用,为语义分割指定空间依赖关系,

2025-11-20 16:15:15 160

原创 WTConv

4、级联分解,对低频分量XLL进行重复小波变换,每次使用小波变换都会分解一层,每层分解均会提高频率分辨率,降低孔家分辨率,进而构成多尺度的特征金字塔,是大感受野的关键手段,级联的层次越多,有效感受野越大,但是参数仅仅对数级别的增长。2、每层的卷积核Wi,仅需要适配当前i层的小波区域的维度特征,对于参数要求降低,参数随着分解层数的进行对数据增长。2、小卷积核+多频率带聚焦,每个分结构的分量,先用小卷积核处理,后将处理结果融合,1、Haar 小波,核心思想,小波变换,转变为,可微卷积操作,从而嵌入CNN架构。

2025-11-19 14:55:16 409

原创 ContextGuidedBlock_Down

在所有阶段都嵌入 “上下文特征(CF)模块”,同时从 “语义层面(深层,捕捉大尺度关联,如‘虫害属于哪类场景’)” 和 “空间层面(浅层,保留小目标细节,如‘蚂蚁的触角纹理’)” 双维度捕捉上下文,这是其 “轻量且高精度” 的核心设计。4、全局上下文----全局平均池化(GAP)+ 全连接层(FC),融入整个图像的全局语义,通过逐元素乘法调整联合特征的权重。3、联合特征------激活的批归一化,融合 “局部 + 周围”两个模块的机械能融合 特征,强化二者的互补性。问题:1、模型太大了,轻量模型太差了。

2025-11-16 19:43:47 249

原创 复杂场景下水稻害虫检测算法

提出新的特征融合网络,替代neck,通过多层次特征的高效融合,增强对小目标感知能力和检测效果,采用动态上采样,替代原本上采样,提高多尺度的特征融合过程中的插值精度。使用心设计的四检测头,进一步优惠啊多尺度特征利用和融合。主干网络用引入MDConv卷积,增强对网络形变的能力。

2025-11-16 16:03:41 92

原创 最新Kolmogorov-Arnold网络架构下的KANConv

1、Kolmogorov_Arnold网络,该架构将该网络KANS的非线性激活函数,整合到卷积层中,代替传统的CNN中的卷积函数去非线性变换、2、KANConv层引入了更多参数,每个卷积核都需要额外学习函数,能够更好的捕获数据中的空间关系,一、最新Kolmogorov-Arnold网络架构下的KANConv。

2025-10-08 21:40:47 258

原创 最新ECCV最新大感受野的小波卷积

eg,有个K*K的感受野,提出方法训练参数数量随着K的对数级别增长,成为WTconv,具有现成的架构可直接替换模块,3、解决方案,WTConv利用小波变换,通过多频率相应扩展卷积的感受野,去在不同频率范围执行小的卷积操作,2、问题,在传统CNN受限于卷积核的大小,感受野不能太大,不然参数会爆炸,难以捕获全局上下文信息,感受野扩大,WTConv通过层级小波分解,潜在不增大参数来的情况下,明显的增大CNN 的感受野。通过小波分解,模型可以在更大的范围内捕获更低频的信息,且能避免模型的过度参数化,

2025-10-08 21:24:29 205

原创 AIFIde

1、Backbone 骨干网络,输入图像进入骨干网络,骨干网络的作用是从原始图中提取更多的尺度的基础特征,自我注意力机制允许模块在处理特点部分的数据,同时考虑数据其他部分,适合处理具有丰富语义信息的高级图像特征。筛选后的查询信息进入解码器,结合后续的检测头,最终完成目标的定位和分类等任务,输出对图像中的检测结果。基于认识到高级特征层包含丰富的语义概念,更加有效的捕获图像中的概念实体联系,经过编码处理后的特征进入该模块,进行交叉比相关的感知机,筛选出更有价值的查询。一、AIFI模块改进特征金字塔网络。

2025-10-08 20:51:37 246

原创 添加最新的LSKNet遥感目标检测网络主干

3、前馈网络模块,该模块用于通道混合核特征的精炼,由一个完全链接的层核一个深度卷积,袷GELu激活函数,第二个全连接层组成,目标实体高特征的质量并且为其分类核检测。该两个子块共同的构成了LSKNet块,能够提高大范围的上下文的信息,同时保持对细节的敏感读,对于u遥感目标很重要。能够动态的调制大空间接受场地,能够更好的去模拟遥控场景下各对象的上下范围。动态调制大的感受野,去更好的捕获遥感场景内,不同对象的检测范围大小,2、大型核选择子块,图像能够动态的动态的调制整个感受野。更好的捕获遥感场景中的对象。

2025-10-07 21:50:59 216

原创 yoloVV11 SPPF篇 | 2024最新AIFI模块改进特征金字塔网络

接受AIFI模块的的单尺度特征后,将backbone输出的多尺度特征进行多次融合操作,将不同的尺度的上下文信息整合到一起,生成更加全面的多尺度特征,2、选择特征的交互,AIFI模块专注于高级层上,进行内部尺度的交互,基于认识到高级特征层包含的更丰富的语义概念。作用,对于输入图像的输出,将原始图像进行初步额特征提取,转换为不同的尺度,包含不同的语义信息特征图,S3下采用,S4不变,S5下采用放大。AIFI借助自注意力机制让,同一尺度的特征,能够动态的计算每个位置与其他位置的关联权重,强化关键区域的特征,

2025-09-30 16:32:40 497

原创 SPPF篇 | FocalModulation

提出,焦点调制网络,。焦点上下文是是焦点调制的一个部分,焦点上下文化,是使用一系列深度卷积层来编码不同范围上的视觉信息,时提出的特征增强方法,利用注意力机制去聚焦于图像中的关键区域,去提高模型 对这些区域的识别能力。总结,SPPF是允许网络处理各种尺寸的输入图像中,产生相同大小的输出图像大小,保持较高的效率。焦点调制方法,将空间上下文以不同的颗粒度去聚合到调制器后,将查询机制的调脂鳍去注入查询令牌中。2、门控聚合,是哟通过门控机制,选择性的将上下文的信息去聚合到每个查询查询令牌的调制器中。

2025-09-26 16:31:00 348

原创 意力机制 | 添加Deformable-LKA可变形大核注意力

3D D_LKA模型扩展了技术,能够去处理三位数据集,充分立体图像体积的数据中的上下文信息,去交叉加深数据的深度理解,尤其,在多个层面分析核识别图像的特征,在医学冲构建 3D图由大用处。该机制能够是的卷积层去灵活的捕获更重形态的结构‘,通过图像信息去动态的增加偏移量,可变形卷积能够提高自视用的内核形状,有主意提高分割精准性。增强模型对不规则物体的捕获能力,可变形卷积通过添加额外的偏移量去调整便准卷积的采样位置,允许卷积核动态的去适应图像的内容。提出的注意力机制收益五可变形卷积来灵魂或的扭曲采样网络,。

2025-09-26 15:01:42 341

原创 Neck篇 | Slim-Neck替换特征融合层

1、GSConv的引入,是为了在CNN 中加快图像的预测计算,在传统的CNN中,空间信息逐渐变成通道信息,在过程中每次特征图压缩和通道扩张都会丢失语义信息的部分丢失。在目标检测器中ncek是链接cnn大的主干网络和头部网络部分,负责特征认同和和处理去提高检测的准确性和效率。3、VOVGSCSP,时一次性聚合方法设计额跨阶段的网络模块,对于不同阶段的特征图进行有效的信息融合。去搭建CNN 的颈部,不同尺度的特征图通过GSCSP模块去处理,通道密集的卷积计算,最大程度的保留了每个通道之间的链接,

2025-09-25 11:38:16 473

原创 LSKAttention大核注意力机制应用于YOLOv8

主要通过深度卷积层2D 卷积分解为水平核垂直的卷积核,减少计算的复杂性,核内存占用同,将注意力机制整合到yolo中,去处理大型模型的数据集核复杂视觉任务的效率核准确性,1、将LSKAttention大核注意力机制用于yolov8。LSKAttention大核注意力机制应用于YOLOv8。LSk注意力机制原理。

2025-09-24 09:49:14 125

原创 SPD-Conv (空间深度转换卷积

在卷积操作时卷积核在输入特征上挨个移动,五跳过任何像素,确保像素上每个位置都能使用卷积核操作,尽量去保留信息,丰富特征的表示,5、非步长卷积,使用步长为1的卷积,去对通道数进行缩减为C2,同时保持空间的分辨率。SPD层,该层将特征图的空间维度转化为深度维度,通过增大通道数去去保留更多的信息,在SPD层后,使用非步长的卷积层,有助于在降低通道数的同时利于参数对于特征的处理。SPD层后还跟步长为1的非步长卷积层,进一步处理特征图,去提取信息,四、非步长卷积层,非步长卷积层是采用步长为1的卷积操作,目的是降维,

2025-09-22 12:15:40 680

原创 OLOv8换个RT-DETR

我们设计了一个高效的混合编码器,通过解耦内部尺度交互和跨尺度融合处理多尺度的特征,提出感知IOU的查询,通过解码器去提供高质量的初始对象查询去进一步提高性能。我们提出检测器支持同构不同的解码器层在不需要重新训练的情况下去灵活的调整 推理速度,有助于在各种实时场景的实际应用,我们具有更高的速度和精度、负责输出最终检测结果,包括对象的类别,位置大小等,通过设计,RTDETR能够端到端的矿界内完成整个目标检测流程,依赖传统的基于锚点方法的设计。用来提升模型的性能,预测头直接用于解码器输出,,

2025-09-22 10:32:20 275

原创 AKConv轻量级架构

核心思想是为卷积核提供了任意数量的参数和任意采样形状,能够使用各种参数量去提取特征。此外我们通过大小相同的初始采样形状不同的AKConv去探究神经网络的效果。思想采用,可变核卷积,他为卷积核提供任意大小的卷积核定义初始位置,我们为了适应目标的变化,引入偏移量,去调整每个为位置的样本形状,1、没卷积操作被限制在局部窗口内,2、卷积核是大小固定的正方形。AKConv是变核卷积,目的是去解决卷积操作中的固有缺陷,AKConv通过不规则的卷积操作完成了高效的特征提取。为卷积采样啊提供了更多的选项。

2025-09-20 15:37:35 174

原创 添加RFAConv重塑空间注意力

给大家带来的RFAConv是一种全新的空间注意机制,与传统的相比mRFAconv能够有小的去处理图像的给各种细节和复杂模式。关于该空间注意力有效性的新视角,对空间注意力机制在本质上去解决了卷积核参数共享的问题。空间注意力生成的注意力包含的信息对于大尺寸的卷积核是信息不足的,被广泛的应用于提升卷积神经网络的性能,但是具有一定的局限性。对于空间注意力模块包含,卷积快注意力模块核协调注意力模块。使用感受野注意力卷积操作u去替代原本的标准的卷积操作。对于大尺寸的卷积核提供了有效的注意力权重。

2025-09-17 16:08:24 163

原创 DWRSeg扩张式残差

我们精心设计了扩张率和每个阶段扩张卷积的容量,为了高级和低级网络分别设计了扩张残差模块和简单反向残差模块,形成强大的DWR分割网络。充分利用每个网络阶段去实现不同预取大小的特征图,需要精心设计扩张率和深度而分离卷积的 容量,去匹配每个网络阶段的不同接受要求。设计可能会因为不合理的结构和超参数去导致难以获得多尺度上下文的信息,为了降低提取尺度的上下文难度,我们提出高效方法。该方法能让网络更急灵活的适应不同尺度的特征,准确的识别出和分割图像中的物体,充分利用的区域特征图,设计了扩张率和每个阶段扩张卷积的容量。

2025-09-17 10:45:19 432

原创 软考高级第四章

信息系统规划,在组织内部发展去基于组织发展战略,发展愿景,和系统框架。面向全局性长远性,具有较强的不确定性和系统概括性,结构化程度较低。具有战略性原则,整体性原则,先进性原则,指导性,柔性,遵循性。具象数字能力建设的管关键任务。使用自顶向下分解自底向上聚合。确立组织关键数字能力为目标。明确数字能力标准和控制措施。统筹部署管理相关监视额资源。明确组织数字能力建设路径。信息系统规划特点和原则。

2025-09-16 14:26:25 138

原创 SAConv可切换空洞卷积

SAC核心时相同的输入儿子应用到不同空洞率去进行卷积,设计特别开关函数融合这些不同卷积的成果。专门为增强物体检测和分割任务,中特征提取去设计。该方法可让网络更灵活的适应不同尺寸的特征。带来的改进机制时可切换的空洞卷积。SAConv可切换空洞卷积。更准确的识别分割图像物体。是一种创新型卷积网络。

2025-09-15 16:12:27 216

原创 FocusedLinearAttention

而线性注意力提供了一种更为高效的替代方案,其通过精心设计的映射函数通近softmax 操作,具有线性复杂性。在本文中,我们提出了一种新颖的聚焦线性注意力模块,以实现高效性和表达能力的双重目标。为了克服这些限制,我们引入了一个简单而有效的映射函数和一个高效的排名恢复模块以增强自注意力的表达能力同时保持较低的计算复杂性。广泛的实验证明,我们的线性注意力模块适用于各种先进的视觉 Transformer,并在多个基准测试中始终实现了改进的性能。该模块通过简单的映射函数调整查询和键的特征方向,时注意力权重更加明显。

2025-09-15 16:00:33 342

原创 损失函数篇 | MPDIoU、InnerMPDIoU

带来的改进机制是 最新的 损失函数 MPDIoU 和融合了 最新的Inner思想的InnerMPDIoU (效果打爆之前的所有的损失函数) 提升检测精度和处理细节方面的作用。问题:在目标检测和实力分割的过程中,传统的边界回归难以优化预测框和真是框的尺寸不同问题。翻译:在真实框和预测框中不同尺度的时候,用MPDlou算法得出的框能效果更加好。边界框回归,适用于目标检测和实力分割中,目标定位的一个重要步骤。绿色框代表真实的边界框 , 而红色框代表预测的边界框。宽度和高度不同时,无法优化,

2025-09-15 14:31:18 267

原创 软件高级第三章

将复杂的业务结构进行可量化,去可调度最小能力单元,通过人员技术数据流程的标准化封装。各类组织数字化主要设计组织,技术,数据,资源,数字化运行,数字化生产没数字化服务。数字商业化模型,数字化转型是富有活力的数字化商业模式。数字转化,数字升级–是业务模式为目标。形成细化的可灵活调度和编排的能力因子。能力银子的定义和数字化封装,

2025-09-12 15:33:22 232

原创 carafe提高精度上采样

2、核预测模型,根据输入特征的额内容,重新生成特定的核,在用内容感知重组模块来根据新生成的核来重组特征。思想,使用输入特征本身的内容去灵活知道上采样过程去实现更加精准和高效的特征重建。给一个尺寸的特征图核上采样率,去用carafe重组生成新的尺寸特征图。利用每个位置的底层内容来预测重组核,在定义附近区域内重组特征,caratf核心是增强卷积神经网络特征图,采用上采样方法,1、先预测每个位置的重组核,用预测重组核去重组新的特征,CARAFE是即插即用的上采样机制,本身没啥使用限制。

2025-09-12 11:29:07 231

原创 inner损失函数损失函数

4、处理高低IOU样本,对于高iou样本,使用较小的辅助框加速摸模型学习,对于低iou样本使用较大的辅助框改善,在处理高度重叠时目标,传统的IOU交并比考虑预测边界框和真是边界框重叠区域,而inneriou损失函数,专注于内边界框内部重叠部分,引入辅助边界框,2、调整尺度,控制辅助边界框的大小,对不同的数据集和检测任务进行微调。总结,inneriou是更细致,专注于目标中心,通过辅助框提高效率。1、针对型优化,关注边界的核心部分,对于重叠区域有更加精确的评估。核心思想,引入不同尺度的辅助边界框计算损失,

2025-09-12 10:24:53 237

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除