- 博客(62)
- 资源 (10)
- 收藏
- 关注
原创 学习记录——BiFormer
作为视觉转换器的核心组成部分,注意力是捕捉长期依赖关系的有力工具。然而,这样的能力是有代价的:当计算跨所有空间位置的成对令牌交互时,它会产生巨大的计算负担和沉重的内存占用。一系列的作品试图通过引入手工制作和内容不可知的注意力稀疏性来缓解这个问题,例如将注意力操作限制在局部窗口,轴向条纹或扩展窗口内。与这些方法相比,我们提出了一种新的动态稀疏注意,通过双层路由实现更灵活的内容感知计算分配。
2023-12-30 11:45:23
1344
原创 学习记录——BiSeNet V2
在语义分割中,低级细节和高级语义都是必不可少的。然而,为了加快模型推理的速度,目前的方法几乎总是牺牲底层的细节,这导致精度大大降低。我们建议将这些空间细节和范畴语义分开处理,以实现高精度和高效率的实时语义分割。为此,我们提出了一种高效的架构,在速度和精度之间进行了良好的权衡,称为双边分割网络(BiSeNet V2)。该架构包括:(i)一个细节分支,具有宽通道和浅层,用于捕获低级细节并生成高分辨率特征表示;(ii)语义分支,通道窄,层次深,获取高级语义上下文。
2023-12-29 17:37:34
1185
原创 BUG记录——drawio出现“非绘图文件 (error on line 7355 at column 83: AttValue: ‘ expected)”
当时突发奇想 我把后面这几行替换了 试了一下,结果真的就好了。这只是我自己摸索到的解决办法并不一定适用于所以人,对我是适用的。可以看到最后一行的代码时不完整的,具体怎么改当时我也不知道。首先用记事本打开损坏的drawio文件,如下。之后我用记事本打开了一个正常的文件,如下。把损坏文件里的最后2行替换掉。用正常文件里的最后四行,如下。
2023-12-22 09:57:41
2656
3
原创 我的创作纪念日——365天
最终我选择了 优快云,一来是因为 优快云 对 Markdown 语法的支持较为全面,UI 外观也比较符合我的审美;二来是之前学习的时候也经常在 优快云 上查找资料(优快云 的 SEO 优化做的不错)。收获就是真的没啥收获啊!发了这吗多,也不送个csdn VIP会员什么的。以后可以找个出卖肉体的地方!(想歪了吧,希望以后可以找个好工作!主要还是想找一个好的保存 Markdown 笔记的平台。当记笔记了,忙的时候很多也没记,,,记录自己学习生活中学到的知识。练习自己的语言组织能力。成就当然是没啥成就。
2023-11-19 13:12:21
427
原创 BUG记录——ImportError: /usr/lib/x86_64-linux-gnu/libstdc++.so.6: version `GLIBCXX_3.4.26‘ not found
最后我发现我的bug定位到了导入 scipy这个包这一行了, 我就把这个包卸载了重装了个低版本的 直接解决了。网上看了很多博客都没解决。
2023-11-10 21:10:26
140
原创 CVPR、ECCV、WACV、ICCV会议举办时间地点及出版地和出版社
CVPR(计算机视觉和模式识别会议)是计算机视觉和模式识别领域最顶级的学术会议之一,每年召开一次,由美国计算机视觉和模式识别协会(Computer Vision and Pattern Recognition)主办。CVPR会议涵盖了计算机视觉和模式识别的各个方面,包括图像处理、模式识别、机器学习、图像理解、人脸识别、目标检测等。会议通常邀请领域内的知名专家学者、企业代表和研究生等参加,共同探讨计算机视觉和模式识别领域的前沿技术和应用发展。
2023-11-10 17:39:59
12052
2
原创 学习记录——StyleGAN2+SA-UNet
IterNet网络利用U-Net,通过将多个小U-Net连接起来,取得了优势。IterNet的工作方式是首先生成粗糙的分割地图,然后通过在小区域上应用小型U-Net来改进分割地图。SA-UNet的主要优势在于它结合了U-Net、SD-UNet和空间注意力块。SA-UNet的架构与U-Net非常相似,但SA-UNet的参数更少,因此训练过程更短,过拟合问题更不容易发生。在SA-UNet中,Dropout被DropBlock取代,DropBlock会丢弃感兴趣区域,而不是随机丢弃权重。
2023-10-08 21:41:45
440
原创 学习记录——MC-Net
2022 用于医学CT图像分割的多尺度上下文注意网络编码器-解码器卷积神经网络在编码过程中丢失了细节,从而限制了准确性的提高。为了解决这个问题,本文提出了一种(MC-Net)。其关键思想是探索用于医学。通过引入多尺度和上下文注意力模块,。为了进一步提高分割准确性,本文根据像素是否属于目标赋予它们不同的权重。
2023-09-11 11:36:22
456
原创 学习记录——VAN LKA、LSKA
2022 大核注意力机制LKA在本文中,提出了一种新的大核注意力large kernal attention(LKA)模型, LKA吸收了卷积和自注意的优点,包括局部结构信息、长程依赖性和适应性。同时,避免了忽略在通道维度上的适应性等缺点。
2023-09-10 21:35:01
1318
原创 学习记录——关UNet、特征图add、cat、相乘、三个 注意力
通俗的来讲就是在网络的高层(就是U型的上部分),获取了图形的细节信息(因为这时候图片很大,很多细节可以得以保留)。特征图拼接的优点是能够保留两个特征图的所有信息,适用于需要同时考虑不同特征的任务。通过add操作,会得到新的特征,这个新的特征可以反映原始特征的一些特性,但是原始特征的一些信息也会在这个过程中损失。这部分有利于将下采样的各个阶段的信息在上采样过程中进行整合,就是在上采样的过程中,结合了各个层次的结构信息。特征图相乘的优点是可以增强共同出现的特征并减弱不重要的特征,适用于需要突出共同特征的任务。
2023-09-10 19:53:18
842
原创 学习记录——Efficient MOdel轻量化主干模型(iRMB、EMO)、CATnet
结合 CNN 和 Transformer 的倒残差移动模块设计ICCV-2023实例化了一个面向移动端应用的iRMB基础模块(Inverted Residual Mobile Block,倒残差移动模块),其,并进一步设计了仅由iRMB构成的EMO, Efficient MOdel轻量化主干模型。结合CNN/Transformer结构的优点来构建类似IRB的轻量级基础模块。
2023-08-31 09:37:57
1270
1
原创 学习记录——FeatEnHancer
一种适用于任意低光照任务增强方法ICCV 2023 提出了FeatEnHancer,一种用于低光照视觉任务的增强型多尺度层次特征的新方法。提议的解决方案重点增强相关特征,通过提供强大的语义表示,使其优于现有的低光照图像增强方法。该方法不仅改进了单个特征的质量,而且还有效地结合了来自不同尺度的特征,确保在诸如物体检测和分割等任务上达到更好的性能。 FeatEnHancer的模块,该模块借鉴了多头注意力机制,层次性地结合多尺度特征。这种方法确保了网络能够提取更具代表性和判别行的增强特征。具体地,该方法着眼
2023-08-25 19:18:38
1206
1
原创 我的创作纪念日——256天
最终我选择了 优快云,一来是因为 优快云 对 Markdown 语法的支持较为全面,UI 外观也比较符合我的审美;二来是之前学习的时候也经常在 优快云 上查找资料(优快云 的 SEO 优化做的不错)。事实上最开始我根本不指望我的博客有多少人看,主要是想找一个好的保存 Markdown 笔记的平台。成就就是没啥成就,也不送个csdn VIP会员啥的,发了这吗多。其实我是把写博文当成了我记笔记的工具。为和我同一个学习阶段的朋友提供帮助。记录自己学习生活中学到的知识。希望以后能成为大佬!
2023-08-02 09:12:07
340
原创 学习记录——TransNormerLLM、SRFormer、PLG-ViT、EfficientViT
2023Transformer 存在局限。首要的一点,它们有着对于序列长度的二次时间复杂度,这会限制它们的可扩展性并拖累训练和推理阶段的计算资源和时间效率。TransNormerLLM 是首个基于线性注意力的 LLM。其中值得格外注意的一项改进是将 TransNormer 的,从而可提升全局的互动性能。研究者还。
2023-07-31 22:21:14
924
1
原创 学习记录——Octave Convolution、LSK
自然世界中的图像存在高低频,卷积层的输出特征图以及输入通道,也都存在高、低频分量。低频分量支撑的是整体轮廓,高频分量则关注细节,显然,低频分量是存在冗余的,在编码过程中可以节省。下图直观地展示了八度卷积的卷积核,可以看出四个部分共同组成了大小为 k*k 的卷积核。其中,in和out分别表示输入和输出特征图的相关属性,在这篇文章中,输入的低频占比、通道数量都和输出的一致。八度卷积的思想是为处理输入数据提供两个单独的路径:一个用于高频(细粒度)信息,另一个用于低频(粗粒度)信息。
2023-07-31 21:19:23
421
原创 点积,内积,哈达玛积的区别
点积、内积和哈达玛积是三种在不同数学和算法领域中使用的运算,它们有不同的定义和用途。在几何学中,点积也可以用于计算两个向量之间的夹角以及判断它们是否垂直或平行。内积的线性性质: = c内积的对称性: =
2023-07-24 17:15:40
1678
原创 学习记录——SAM、SPM
能分割一切的模型 2023 SAM是一个提示型模型,其在1100万张图像上训练了超过10亿个掩码,实现了强大的零样本泛化。许多研究人员认为「这是 CV 的 GPT-3 时刻,因为 SAM 已经学会了物体是什么的一般概念,甚至是未知的物体、不熟悉的场景(如水下、细胞显微镜)和模糊的情况」,并展示了作为 CV 基本模型的巨大潜力。 2023年4月6号,Meta AI公开了Segment Anything Model(SAM),使用了有史以来最大的分割数据集Segment Anything 1-Bill
2023-07-18 22:20:58
1219
原创 学习记录——SpectFormer、DilateFormer、ShadowFormer、MISSFormer
SpectFormer结合了光谱注意力和多头注意力。
2023-07-18 22:20:32
2014
原创 学习记录——语义分割、实时分割和全景分割的区别、几个Norm的区别、Dice 、BCE
语义分割(Semantic Segmentation):语义分割是将图像分割成多个语义区域的任务,即将图像中的每个像素分配给特定的语义类别。每个像素都被标记为属于不同的类别,例如人、汽车、树等。语义分割关注的是像素级别的分类,目标是理解图像中不同物体的位置和边界。实时分割(Real-Time Segmentation):实时分割是指能够在实时或接近实时的速度下进行图像分割的任务。实时分割通常要求在处理连续的视频帧时保持高帧率,以实现实时的交互或应用。
2023-07-18 11:05:19
869
原创 学习记录——BiSeNetV1、BiSeNetV2、BiSeNetV3、PIDNet、CMNeXt
Spatial Path: 用了三层stride为 2 的卷积,卷积+BN+RELU模块。最后提取了相当于原图像 1/8 的输出特征图。由于它利用了,所以可以,并生成高分辨率特征图。Contex Path: 上下文路径的backbone可以替换成任意的轻量网络,比如 Xception,ShuffleNet 系列,MobileNet 系列。可以看到,为了准确率考虑,Context Path 这边使用了类似 U-shape 结构的设计,最终进行了32倍下采样。
2023-07-12 20:52:07
1322
原创 学习记录——Transformer、ViT、Swin-Transformer、SegFormer、TopFormer、Seaformer
在原论文中,作者说参考BERT,在刚刚得到的一堆tokens中插入一个专门用于分类的[class]token,这个[class]token是一个可训练的参数,数据格式和其他token一样都是一个向量,以ViT-B/16为例,就是一个长度为768的向量,与之前从图片中生成的tokens拼接在一起,Cat([1, 768], [196, 768]) -> [197, 768]。如上面的框架图所示,该网络先对图像进行1/2、1/4和1/8的下采样,再分别用两个分支进行处理,红色的是上下文分支,蓝色的是空间分支。
2023-07-12 15:36:51
1674
原创 基础学习——关于list、numpy、torch在float和int等数据类型转换方面的总结
因为自己最近总是遇到一些list、numpy、torch的数据类型转换错误,特别是不同类型间的float转int或int转float,总是遇到错误,所以在这里总结一下。1.数字(Number);2.字符串(String);3.列表(List);4.字典(Dictionary);5.元组(Tuple);1.int–整型2.float–浮点型3.bool–布尔型4.fractions–分数5.complex–复数。
2023-06-04 13:37:42
1875
原创 基础学习——读txt数据、字符串转list或数组、画PR曲线、画Loss曲线
是Python中的一个字符串方法,它可以将一个字符串按照指定的分隔符分割成多个子字符串,并返回一个由这些子字符串组成的列表。例如,如果有一个字符串"hello world",我们可以使用.split()方法将它按照空格分隔成两个子字符串[“hello”, “world”]。如果没有指定分隔符,则默认使用空格作为分隔符。把类似于这样的数据读出来转为list,然后画图。代码注释很详细,这里就不解释了。
2023-05-27 20:19:52
1304
原创 DRIVE视网膜血管分割——基于像素点分割(BP网络和CNN网络)
视网膜血管分割是一种计算机视觉任务,旨在从眼底图像中分割出视网膜图像的血管。这个任务对于糖尿病视网膜病变等眼部疾病的早期诊断和治疗至关重要。视网膜血管分割的方法主要有两种:基于规则的方法和基于深度学习的方法。基于规则的方法通常需要手工设计特征提取器和分类器,而基于深度学习的方法则利用深度神经网络来自动地学习特征并进行分类。近年来,基于深度学习的方法在视网膜血管分割中取得了许多优秀的成果,成为当前的主流方法。
2023-05-18 17:39:01
2629
4
原创 pytorch优化器——add_param_group()介绍及示例、Yolov7 优化器代码示例
最近遇到了一个关于优化器的bug,困扰了我很多天,然后自己系统学习了以下pytorch优化器的知识,总结记录如下。
2023-05-03 21:50:54
2074
原创 Bug记录——nn.Parameter()参数不更新、根据loss自学习权重变量不更新、pytorch 模型自定义参数不更新、网络梯度为None,参数不更新解、tensor参数有梯度,但不更新
记录一个bug。bug描述:这是关于一个Pytorch模型自定义nn.Parameter()参数不更新的bug。就是用nn.Parameter()定义一个参数变量,它可以根据loss调整大小。1、看该变量的梯度是否为0或者为None。2、学习率是否过小和过大。3、是否加入了optimal的优化参数序列中。4、softmax也会使结果失去梯度,用log_softmax代替。5、torch.argmax(),会使结果失去梯度。
2023-05-03 14:51:46
5574
7
原创 基础函数——enumerate()、hasattr()、isinstance()
enumerate一般与for循环连用。Python中的enumerate函数是一个内置函数,它可以对一个可迭代对象(如列表或元组)添加索引,并返回一个枚举对象。枚举对象可以直接用于循环或转换为元组列表。通过enumerate 函数可以很方便的获取到序列中的索引和值。
2023-05-02 21:20:11
369
原创 pytorch学习率设置——optimizer.param_groups、对不同层设置学习率、动态调整学习率
我的需求:我需要在yolov7中更改其中一层的学习率,但yolov7的学习率是随着eporch的变化动态变化的。
2023-05-02 15:55:21
6691
原创 Canny边缘检测算法
噪声去除:首先,使用高斯滤波器降噪,以平滑图像。为了尽可能减少噪声对边缘检测结果的影响,所以必须滤除噪声以防止由噪声引起的错误检测。为了平滑图像,使用高斯滤波器与图像进行卷积,该步骤将平滑图像,以减少边缘检测器上明显的噪声影响。其中Sigma为方差,k确定核矩阵的维数。高斯卷积核大小的选择将影响Canny检测器的性能。尺寸越大,检测器对噪声的敏感度越低,但是边缘检测的定位误差也将略有增加。一般选取5x5。梯度计算:然后,使用Sobel算子计算图像的梯度强度和方向。
2023-04-28 11:20:25
1216
原创 关于STM32货车油箱防盗器程序及使用的介绍说明
课程作业,记录一下。随着科技的发展,网上购物、直播带货等购物方式的出现,物流行业也随之崛起,随之加入的还有越来越多的货车司机。在农村,每隔几户几乎都会有一个货车司机从事物流行业,虽然带给了司机高利润,但是同时也伴随着被一些不法分子偷油的的风险。本设计主要为了解决以上问题,为货车司机在长时间驾驶货车后休息时提供一个安心睡觉的环境,而不用去警醒油耗子偷油,让司机安心睡觉。本设计采用STM32f407zgt6为主机主控芯片、STM32rct6为从机主控芯片+LoRa模块+WIFI模块+震动传感器+人体检测模块。
2023-04-23 10:41:42
703
原创 BUG记录——ESP8266 连接原子云流程及一些bug
最近在做老师留的作业,,,,,用到了这个模块,,,,模块如下图,这个模块我买的比较早跟最新的封装不太一样。测试工具:一个下载器, 把wifi模块直接连到下载器上rx接tx,tx接rx。以下软件和资料都是在[正点原子官网],我的模块买的比较早,我这里使用的他旧资料里的软件。highlight=esp8266)下的。
2023-04-21 21:10:41
1176
原创 BUG记录——关于keil5打不开工程文件、闪退、不显示的bug
最近在做一个嵌入式的作业,在配置esp8266时遇到了工程文件打开不显示和打开了闪退的问题,刚开始我以为是版本不兼容就把keil5卸载了,下载了一个最新版,但是问题还在。之后就试了很多方法,最后记录一下尝试的方法。
2023-04-20 21:27:00
19426
14
原创 PyTorch学习——关于tensor、Variable、nn.Parameter()、叶子节点、非叶子节点、detach()函数、查看网络层参数
学习小计。
2023-04-17 16:20:54
971
原创 机器学习——使用朴素贝叶斯分类器实现垃圾邮件检测(python代码+数据集)
这段代码实现了一个朴素贝叶斯分类器来对电子邮件进行分类,其中包括读取数据、文本预处理、训练分类器和预测新邮件的过程。具体来说,代码中使用 get_data 函数从指定目录 DATA_DIR 中读取数据,并将 Spam 和 Ham 的电子邮件内容分别存储在 data 和 target 列表中。在数据预处理过程中,使用 preprocess 函数对文本进行处理,包括转为小写、去除标点符号和停用词等操作。接下来实现了 NaiveBayesClassifier 类的 fit 和 predict 方法,其中 fi
2023-04-13 21:00:38
11225
44
高光谱图像分类(India数据集)-基于像素点分类(bp网络和cnn网络)
2023-06-15
PR曲线、Loss曲线代码(用python把txt文件中的数据提取出来画线)
2023-05-28
DRIVE视网膜血管分割-基于像素点分割(BP网络和CNN网络)代码工程
2023-05-18
STM32货车油箱防盗器程序及资料
2023-04-23
机器学习-使用朴素贝叶斯分类器实现垃圾邮件检测(python代码+数据集)
2023-04-14
Chaoy的蓝桥杯单片机程序-程序模板、模块驱动函数、国赛程序、省赛程序和赛题等资料
2023-03-28
Scikit-learn库相关代码
2023-01-18
32步进电机.zip
2019-07-31
TA创建的收藏夹 TA关注的收藏夹
TA关注的人