自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(18)
  • 收藏
  • 关注

原创 可视化感受野

代码分为两部分 一部分是根据模型生成 contribution_scores 一部分是可视化 下面是代码。通过visualize_erf生成 contribution_scores。然后是通过analyze_可视化contribution_scores。我的模型是基于resnet18的 所以感受野可能比较小。在这篇论文中提到了如何可视化感受野。我的resnet18 可视化。昨天复现了一下今天做一下记录。

2024-11-27 10:20:27 508

原创 FileNotFoundError(f“Couldn’t find any class folder in {directory}.“) FileNotFoundError: Coul

最近在复现感受野的可视化 Scaling Up Your Kernels to 31x31: Revisiting Large Kernel Design in CNNs 其中的visualize_erf.py报错了。在要访问的图像的文件夹上再建一个文件夹 不明所以但是奏效 以后再研究吧。解决方法 参考的这篇博文。

2024-11-25 13:44:55 332

原创 BatchSize对模型精度的影响

对于二阶优化算法,减小Batch Size带来的收敛速度提升远不如引入大量噪声导致的性能下降,因此在使用二阶优化算法时,往往要采用大Batch Size才能发挥出最佳性能。较小的Batch Size意味着每次迭代处理的样本数量较少,这可能会导致训练速度较慢,因为需要更多的迭代次数来完成整个数据集的训练。较小的Batch Size可能导致梯度下降过程中的震荡较大,因为每次迭代只使用了部分样本的信息,这种震荡可能会使模型在收敛过程中偏离最优解,导致训练结果不稳定。

2024-11-01 10:20:32 647

原创 有参数上采样和无参数上采样

在深度学习尤其是计算机视觉的上下文中,上采样是将特征图从较低分辨率(例如,小尺寸)转换为较高分辨率(例如,大尺寸)的过程。有参数的上采样和无参数的上采样是两种不同的实现方式,它们的主要区别在于是否涉及可学习的参数。- 有参数的上采样指的是在上采样过程中引入了可训练的参数。1. 有参数的上采样 (如转置卷积)具有学习能力,可以根据训练数据调整机制,以期达到更好的效果,但计算成本较高。- 在一些深度学习框架中,可以定义专门的上采样层,该层可能包含有参数的操作,如线性插值加卷积。

2024-10-30 10:41:30 332

原创 非自适应性上下文

今天看论文 Context and Spatial Feature Calibration for Real-Time Semantic Segmentation介绍创新点的时候原文说我们观察到,上下文不匹配主要来自于上下文建模中的不加区别的处理。具体来说,用于聚合上下文的常用方法[4]、[5]、[6]为每个像素引入了,忽略了它们在上下文需求方面的固有差异。如图 2(a) 所示,对于像素 A 和 B,先前的方法在预定义区域内为它们建模与空间相关的上下文。

2024-10-30 10:30:59 479 1

原创 [论文笔记]MRRNET

摘要:随着物联网(IoT)的大规模部署,道路场景中实时感知和环境理解的需求变得越来越迫切。同时,语义分割作为像素级场景解析得到了广泛的研究。然而,资源有限的物联网设备在语义分割时应考虑实时性和准确性性能。在本文中,我们介绍了一种快速高效的语义分割网络,用于交通场景中的道路感知,部署在云服务器上。为此,我们提出了一种有效且高效的语义分割网络,称为多分辨率细化网络(MRRNet)。它采用编码器-解码器架构,可以有效地通信分支特征。

2024-09-18 17:48:57 2731 1

原创 [Python] CfgNode

在看别人代码的时候是不是经常看见这些个CN()yacs(Yet Another Configuration System)库中的CfgNode类,并将其别名为CNyacs是一个用于处理配置文件的 Python 库,特别是在机器学习和深度学习项目中非常有用。它提供了一个灵活的配置系统,可以使得管理和修改配置文件变得更加简单和高效。CfgNode。

2024-08-30 15:51:04 633

原创 【Python】ArgumentParser用法

模块提供的一个类,用于处理命令行参数。它使得编写用户友好的命令行接口变得简单和直观。description : 描述所创建的ArgumentParser是干啥的 用途。最近看代码 这个类之前都是简单看过去了 今早仔细看了一下 做个记录。参数,则将帮助信息输出到该文件对象;否则,打印到标准输出。参数被指定,则解析该参数列表,否则解析。3> 使用parse_args解析参数。解析命令行参数,并返回一个包含参数值的。是 Python 标准库中的。对象添加一个命令行参数。

2024-08-30 11:18:32 674

原创 【论文笔记】Bisenet 2

低层细节和高层语义对于语义分割任务都是至关重要的。然而,为了加速模型推理,当前的方法几乎总是牺牲低级细节,这导致准确性大幅下降。我们建议分别处理这些空间细节和分类语义,以实现实时语义分割的高精度和高效率。为此,我们提出了一种高效且有效的架构,在速度和准确性之间取得了良好的权衡,称为双边分割网络(BiSeNet V2)。该架构涉及:(i)一个细节分支,具有宽通道和浅层来捕获低级细节并生成高分辨率特征表示;(ii) 语义分支,具有狭窄的通道和深层,以获得高级语义上下文。

2024-08-28 18:12:00 1178 1

原创 【论文笔记】BiseNet 1

语义分割需要丰富的空间信息和相当大的感受野。然而,现代方法通常会牺牲空间分辨率来实现实时推理速度,从而导致性能不佳。在本文中,我们通过一种新颖的双边分割网络(BiSeNet)解决了这一困境。我们首先设计一个小步幅的空间路径,以保留空间信息(spatial information)并生成高分辨率特征(high-resolution feature)。同时,采用具有快速下采样策略的上下文路径(Context Path )以获得足够的感受野(Sufficient receptive fiels)。

2024-08-28 11:34:42 866 1

原创 Balancing the Details and Contexts

这个专题主要写各个论文中平衡细节和上下文信息的模块其设计初衷都是为了不让context path 和spatial path的信息相互淹没会持续更新。

2024-08-06 16:06:01 555

原创 [论文笔记] RDRNET

语义分割在自动驾驶、医学图像等应用中发挥关键作用。尽管现有的实时语义分割模型在准确性和速度之间取得了令人称道的平衡,但它们的多路径块仍然影响整体速度。为了解决这一问题,提出了一种用于实时语义切分的可重参数化双分辨率网络(RDRNet)RDRNet采用两分支结构,在训练过程中利用多路径块,在推理过程中将其重新参数化为单路径块,从而同时提高了推理精度和推理速度。在此基础上,提出了可重参数化的金字塔池模块(RPPM),在不增加推理时间的前提下,增强了金字塔池模块的特征表示能力。

2024-08-03 10:45:59 952 1

原创 [论文笔记]PP-LiteSeg

实际应用对语义切分方法有着很高的要求。尽管语义切分在深度学习中取得了显著的进步,但实时切分方法的性能并不令人满意。为此,本文首次提出了一种新的轻量级的实时语义切分模型PP-LiteSeg.作者主要设计了三个新的模块1: FLD 提出了一种灵活和轻量级的解码器(FLD),以减少以往解码器的计算开销2: 为了增强特征表示,提出了一种统一注意力融合模块(UAFM),该模块利用空间和通道注意力产生一个权值,然后将输入特征与权值进行融合。

2024-07-30 11:43:10 987 1

原创 Resnet中扩展因子expansion的作用

具体地说,假设输入特征图大小为H×W×C(高×宽×通道),经过步幅为2的卷积操作后输出特征图大小将变为H/2×W/2×C_new。(当步幅不为1时,由于卷积操作会缩小特征图尺寸,因此需要通过适当调整扩展因子来确保快捷连接和主路径上的特征图维度对齐,并且使它们的通道数一致,以便进行相加操作。总之,扩展因子在ResNet中用于控制残差块内部卷积层输出通道与输入通道之间的比例关系,并且当出现步幅不为1时需要根据步长变化来进行相应调整以确保主路径和快捷连接能够对齐。今天看了一下 有了新的感受。

2024-07-12 21:43:29 588

原创 [论文笔记] PIDNET

作者首先肯定了双分支的作用 然后说直接融合高分辨率细节特征图和low-frequency(通常指的是变化缓慢或频率较低的部分,也可以理解为图像中较大区域的整体信息或背景信息。这种低频率的内容通常包含了图像的整体结构、背景或环境,而不是细节性的高频率信息)上下文信息可能会出现overshoot现象(可能是两方信息不是很对等 直接融合可能会淹没另一方的信息 细节特征容易被周围上下文信息淹没)

2024-07-10 14:55:39 1759 2

原创 [论文笔记] DDRNET

作者说尽管最近的实时语义分割方法已经很快了 但是仍然比不过基于膨胀卷积的方法 作者提出DDRNET 经典的two-branch 设计了一条新的上下文提取模块(DAPPM)能增大感受野并且能基于低分辨率特征图融合多尺度上下文信息。

2024-07-09 17:31:15 1025 1

原创 [论文笔记]DSNET

作者首先肯定了空洞卷积的作用 发现之前没将空洞卷积应用到模型的浅层(shallow layer)中 并且作者验证使用大的卷积核来应用空洞卷积可能更加有效 作者提出了DSNET 将空洞卷积用在了模型的浅层中 并且将整个enconder都在imagenet上做了预训练 作者说其实现了新sota作者从RepLKNet在这篇论文中得到的灵感说:感受野的有效范围比注意力还关键 说在RepLKNet以及几篇论文中堆叠空洞卷积没啥用 但是他们没在浅层中使用。

2024-07-08 21:22:47 1123 2

原创 [论文笔记] STDC

作者说双分支网络很受欢迎但是多加了一条分支太耗时,并且借用的是分类任务的backbone,没有专门为语义分割设计的.作者提出了STDC网络,逐渐减少特征图的维度.这里没啥好说的,写论文的时候可以仿写,改改可以用. 主要是说分类任务的backbone不能很好适应分割任务.最后两段说了连接多个连续的特征图,为了加快速度,将层的卷积核个数逐渐减少相较于添加另外一条分支,作者使用细节指导来指导低层学习空间特征(这个后面有介绍)

2024-07-04 11:45:51 569 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除