自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Henry的博客

佛系学习,正常摆烂

  • 博客(428)
  • 收藏
  • 关注

原创 Unet 实战分割项目、多尺度训练、多类别分割

之前写了篇二值图像分割的项目,支持多尺度训练,网络采用backbone为vgg的unet网络。本章实现的unet网络的多类别分割,也就是分割可以是两个类别,也可以是多个类别。训练过程仍然采用多尺度训练,即网络会随机将图片缩放到设定尺寸的0.5-1.5倍之间。

2024-02-05 21:38:35 7099 11

原创 K-means算法

通俗版 K-means 解释想象一下,你是一个教练,现在有一群人需要分成K 个队伍。你的任务就是合理分组,让每个队伍内部的人尽可能相似(比如身高相近、兴趣相似等)。具体步骤是这样的:随机选队长:你随便指定K 个人作为初始的“队长”(也就是聚类中心第一次站队:每个人观察自己和哪个队长最接近(比如距离最近),然后站到对应的队伍里。队长重新调整位置:每个队伍的队长不能一直原地不动,于是你让他们移动到当前队伍成员的平均位置(也就是新的中心点)。重新站队:大家再次看看自己离哪个新队长最近,调整队伍。重复调整。

2025-04-02 16:38:42 761

原创 UNet 改进:添加PPA 2024多分支特征提取策略详解

多分支特征提取(Multi-Branch Feature Extraction)是PPA(Pyramid Pooling Attention)2024改进的核心模块,旨在通过。:通过交叉注意力(Cross-Branch Attention)或特征图拼接+1×1卷积实现信息交互。:动态权重机制使模型灵活应对不同输入(如纹理复杂区域激活局部分支,平滑区域依赖全局分支)。:通过轻量级全连接层或SE模块生成各分支的权重,实现动态特征融合。:设计辅助损失函数(如分支特征一致性约束),避免分支退化。

2025-04-02 10:03:53 19

原创 基于openCV的停车场实时车位空余检测

观察检测的效果图,发现车位检测出来了,但是车位的位置不太对因为本文的图片是从一张大图中截取的,因此图像和视频的尺寸对不上,应用中使用相同的标注图像和视频文件即可当然,也可以在图像和视频检测前加一个resize,最后实时监测的时候在resize回去即可。

2025-04-01 09:15:32 264

原创 VGG 改进:添加RFAConv模块优化特征冗余

是一种结合多尺度卷积与双注意力机制(通道+空间)的动态特征增强模块,旨在解决传统卷积层中特征冗余问题,提升模型的特征表示能力。其核心设计思想是通过多分支感受野提取不同尺度的上下文信息,并通过注意力机制动态校准特征重要性,最终实现高效的特征融合。以下从模块结构、关键组件及作用原理进行详细解析。RFAConv的整体结构分为四个核心部分(结构示意图如下):输入 → [多尺度卷积分支] → 特征融合 → [通道注意力] → [空间注意力] → 残差连接 → 输出。

2025-04-01 08:28:21 103

原创 ResNet改进:SE模块和多尺度模块两次改进

SE(Squeeze-and-Excitation)模块是一种轻量级的注意力机制,最初由Momenta和牛津大学的研究者在2017年提出,并在2018年的CVPR会议上发表。它通过显式建模通道间的相互依赖关系,自适应地重新校准通道特征响应,显著提升了多种卷积神经网络的性能。核心思想SE模块的核心思想是让网络能够学习到不同通道特征的重要性,并据此增强有用特征、抑制无用特征。:压缩空间信息,获取全局感受野:学习通道间的相关性,生成每个通道的权重结构组成。

2025-03-30 17:04:44 38

原创 基于pygame实现的吃豆人游戏代码

吃豆人(Pac-Man)是1980年代风靡全球的街机游戏,其核心玩法简单却充满策略性。本文将基于Python的Pygame库,解析一个完整实现的吃豆人游戏代码。(每次游戏不同)(A*算法实现)(幽灵恐惧状态)(生命值、得分、胜负判定)

2025-03-26 15:50:54 602

原创 基于EasyOCR实现的中文、英文图像文本识别

支持加载自定义训练的模型。

2025-03-26 09:13:12 474

原创 VGG 改进:添加ScConv空间与通道特征重构卷积

或更复杂的融合方式如:F_out = Conv1×1(Concat[A_s ⊗ F_in, A_c ⊗ F_in])ScConv 将空间和通道重构有机结合:F_out = A_s ⊗ F_cr + F_in。通过残差连接保留原始信息:F_sr = Conv1×1(F_s) + F_in。形成空间注意力图:A_s = σ(Conv(F_sr)),σ为sigmoid。公式表示:F_s = DWConv(F_in),其中DWConv为深度卷积。将通道权重应用于特征图:F_cr = A_c ⊗ F_in。

2025-03-25 09:30:17 207

原创 基于python脚本实现的打砖块小游戏

球:定义球的半径。ball_x和ball_y:定义球的初始位置,使其位于屏幕中央。和:定义球在水平和垂直方向上的速度。

2025-03-24 13:42:44 816

原创 ResNet 改进:加入Transformer模块

这个类继承了ResNet-34,并在ResNet-34的最后一个卷积层之后添加了Transformer模块。在ResNet-34中添加Transformer模块可以通过在网络的某个位置插入Transformer层来实现。方法中,输入首先通过ResNet-34,然后通过Transformer模块,最后通过全局平均池化和全连接层。: 这是一个简单的Transformer编码器模块,包含多个Transformer编码器层。:与 RNN 不同,Transformer 可以并行处理整个序列,训练速度更快。

2025-03-24 09:24:46 321

原创 第16章:基于CNN和Transformer对心脏左心室的实验分析及改进策略

Encoder部分主要利用Transformer的自注意力机制来提取图像的全局特征,而Decoder部分则类似于UNet的解码器,用于将特征映射回原始图像的分辨率并生成分割结果。在训练过程中,Unet通过将输入图像与对应的标签图像一起输入网络,利用损失函数计算网络输出与标签之间的差异,并通过反向传播算法调整网络参数,使得网络输出能够尽可能地接近标签图像。总的来说,TransUNet模型是一种结合了Transformer和UNet特点的先进图像分割模型,适用于医学图像等领域的任务。

2025-03-21 13:17:31 889

原创 关于深度学习的梯度下降法介绍

梯度下降法是机器学习中用于优化模型参数的核心算法。理解梯度的概念、掌握梯度下降法的基本步骤,并了解其潜在问题及解决方案,是掌握这一“黑魔法”的关键。通过合理选择学习率、使用优化算法的变体以及应对局部最小值和鞍点问题,可以显著提高梯度下降法的性能,从而更有效地训练神经网络。

2025-03-20 15:51:45 835 1

原创 DenseNet 改进:ODConv2d全维动态卷积替换卷积层

(Omni-Dimensional Dynamic Convolution,全维动态卷积)是一种创新的卷积操作,旨在通过多维度动态机制提升卷积神经网络的表达能力。它是对传统卷积(如标准卷积、动态卷积 CondConv 和 DyConv)的进一步扩展,能够在多个维度上动态调整卷积核的参数,从而更好地适应输入特征的变化。然而,现有的动态卷积方法通常只在单一维度(如通道维度)上引入动态机制,未能充分利用输入特征的多维度信息。相比传统的静态卷积和单一维度的动态卷积,ODConv2d 具有更强的灵活性。

2025-03-20 11:18:09 42 1

原创 Pygame实现俄罗斯方块完整代码

这里设置常见的砖块形状,可以自己更改# 7种方块形状(使用矩阵表示)SHAPES = [

2025-03-19 10:50:42 337 1

原创 Vgg 改进:添加ShuffleAttention模块增强跨通道交互能力

ShuffleAttention 是一种结合了通道注意力机制与通道混洗操作的模块,能够增强特征表达能力并促进组间信息交互。其中 W1∈RCG×CG⋅r​, W2∈RCG⋅r×CG​,r 为压缩比。本文 ShuffleAttention 模块 加入的位置在每次下卷积后。:对每组特征分别进行通道注意力计算(类似SE模块)。:重组通道使得不同组的信息能够交互。使用全局平均池化获取通道统计量。操作重组通道,促进跨组信息交换。:将输入特征图按通道分为G组。组,每组独立计算注意力权重。

2025-03-19 10:02:56 29

原创 基于图像处理和机器学习实现的压差表数值读取

目录1. 项目概述2. 算法实现3. 项目目录4. 效果展示5.代码在本章中,将详细介绍如何通过一系列步骤对压差表图像进行数字图像处理并准确读出其刻度值。包含从环境搭建到图像预处理,再到指针识别与刻度读取和存储的全过程。主要包括下面几个步骤:算法首先对输入的压差表图像进行灰度处理,由此可以简化信息,提高处理速度,更加清晰地观察到图像中的关键特征,并为后续的模板匹配和指针识别提供便利。在灰度处理的基础上,利用FLANN(快速最近邻搜索库、SIFT尺度不变性等)匹配器进行模板匹配,快速定位仪表位置,确保后续识

2025-03-18 13:36:33 447

原创 SwinTransformer 改进:添加DoubleAttention模块提升上下文语义提取能力

是一种用于计算机视觉任务的注意力机制,旨在通过双重注意力机制增强特征表示。:关注特征图中哪些空间位置(spatial location)更重要。通过结合这两种注意力机制,模型可以更全面地捕捉特征图中的重要信息。:将通道注意力和空间注意力的结果融合,得到最终的特征表示。模块的核心思想是通过两种不同的注意力机制(通常是。对特征图的每个空间位置进行加权,增强重要位置的特征。:关注特征图中哪些通道(channel)更重要。对特征图的每个通道进行加权,增强重要通道的特征。:输入特征图经过卷积层提取特征。

2025-03-18 09:25:37 447 7

原创 基于Pygame实现2048小游戏

2048是一款风靡全球的数字益智游戏,玩家通过滑动方向键合并相同数字,最终目标是合成"2048"这个数字。本文将使用Python的Pygame库实现该游戏的图形化版本,包含分数统计、动画效果和游戏结束判断等核心功能。本实现完整还原了2048的核心玩法,可以通过以下方式扩展:添加音效和更流畅的动画实现撤销功能增加AI自动求解模块支持不同尺寸的网格(5x5、6x6)通过这个项目,可以学习到:Pygame的基本使用二维数组操作技巧游戏状态管理方向键事件处理。

2025-03-17 13:19:47 529

原创 Vision-Transformer 有效涨点改进:添加CPCA模块

有效涨点!!

2025-03-17 11:13:10 252

原创 第15章:ConvNeXt图像分类实战:遥感场景分类【包含本地网页部署、迁移学习】

它通过借鉴Transformer的设计思想,对传统CNN进行了改进,使其在图像分类等任务中表现优异,甚至超越了Vision Transformers(ViT)ConvNeXt 实现的model部分代码如下面所示,这里如果采用官方预训练权重的话,会自动导入官方提供的最新版本(ImageNet)的权重。:使用更大的卷积核(如7x7)来扩大感受野,类似于Transformer中自注意力机制捕捉全局信息的能力。:借鉴MobileNetV2的倒置瓶颈设计,先扩展通道数再进行深度卷积,最后压缩通道数,提升计算效率。

2025-03-16 20:00:25 984

原创 MobileNet 改进:添加inception模块

Inception 模块通过并行使用 1x1、3x3 和 5x5 卷积核,以及最大池化操作,能够在同一层级上提取不同尺度的特征。传统的卷积网络通常只使用单一尺寸的卷积核(如 3x3 或 5x5),这可能会限制网络捕捉不同尺度特征的能力。不同分支提取的特征在通道维度上拼接(concatenate),形成丰富的多尺度特征表示。先使用 1x1 卷积降维,然后使用 3x3 卷积提取中等尺度的特征。先使用 1x1 卷积降维,然后使用 5x5 卷积提取大尺度的特征。,从而捕捉不同尺度的特征信息。

2025-03-13 12:42:32 150

原创 计算机网络基础:NAT 网络地址转换

NAT:Network Address Translations网络地址转换,解决IP地址不够用的问题公网和私网:私有ip范围:工作设备:1. 静态NAT2. 动态NAT3. PAT静态NAT :只能有一个上网动态NAT :需要三个人抢PAT(port)端口地址转换、端口复用技术:将ip转换成端口号,真正区分内网通过端口号1. 当内网ip访问百度的时候,路由器对地址池进行对比,成功的话将内网访问的端口进行映射(5000--->1)。然后到公网上就变成,路由器用自己公网IP的1端口进行访问2. 百度回包的时候

2025-03-13 11:15:05 331

原创 UNet 改进:添加Transformer注意力机制增强捕捉长距离依赖关系的能力

每个注意力头计算每个输入元素相对于其他元素的重要性,使模型能够专注于输入序列的不同方面。总体而言,TransformerBlock在Transformer模型架构的成功中起着至关重要的作用,并为自然语言处理任务的进步做出了重大贡献。TransformerBlock因其能够捕获序列中的长程依赖关系、并行性以及在处理不同语言对和自然语言处理任务方面的有效性而广受欢迎。这有助于捕捉序列中的复杂模式和关系。然后,前馈神经网络的输出通过残差连接和层归一化,这有助于稳定训练过程并改善训练过程中的梯度流。

2025-03-12 13:32:38 891

原创 计算机网络基础:简单渗透

telnet探测端口。

2025-03-11 14:33:24 179 1

原创 计算机网络基础:PKI(公钥基础设施)

签名:123为公钥,321为私钥。发送的时候用321签名,123解密能解开说明数据正确。数字签名:传输者将哈希值用其私钥加密所得的加密哈希值。数字签名:传输者将哈希值用其私钥加密所得的加密哈希值。

2025-03-11 10:57:08 184 1

原创 计算机网络基础:IIS服务器(FTP服务器)

ftp服务器一般不允许匿名访问,web可以匿名访问。21控制端口、20数据端口。设置权限:和共享一样。

2025-03-10 10:21:58 311 1

原创 计算机网络基础:IIS服务器(WEB服务器)

web服务器也被称为网页服务,或者http服务器。WEB服务器使用的协议是HTTP或者HTTPS。服务器更改:不要使用1000以下的,会被使用。默认的网站在这:要是停止的话,就不能访问。一个服务器可能有多个网卡,需要自己指定。这时候端口号已经打开了,可以访问了。同理创建网站的时候,ip会冲突。不能和用户互动的都是静态网页。客户机访问:需要指定DNS。客服机访问:改变端口号。在DNS不同区域建立。

2025-03-10 09:33:53 670

原创 Vgg 改进:添加TripletAttention模块减少冗余计算

TripletAttention 是一种用于计算机视觉任务的注意力机制,旨在减少冗余计算和同时存储访问,从而提高模型的效率和性能。它通过引入三元组(Triplet)结构来优化注意力机制的计算过程。核心思想:TripletAttention 的核心思想是通过将输入特征图分成三个部分(即三元组),并在每个部分上分别计算注意力权重,从而减少计算复杂度和存储访问的冗余。具体来说,TripletAttention 将输入特征图分为三个通道组,并在每个组上独立计算注意力权重,最后将这些权重合并以生成最终的注意力图。

2025-03-09 19:10:54 170

原创 ResNet 改进:轻量级的混合本地信道注意机制MLCA

2. 全局信道注意力(Global Channel Attention):全局信道注意力则关注整个特征图的全局信息,通过对每个信道进行全局加权,捕捉全局上下文信息。1. 局部信道注意力(Local Channel Attention):局部信道注意力关注于特征图的局部区域,通过对每个信道进行局部加权,捕捉局部细节信息。MLCA是一种轻量级的混合本地信道注意机制,通过结合局部和全局信道注意力,能够在保持较低计算复杂度的同时,提升特征表示能力。1. 特征提取:输入特征图经过卷积层提取特征。

2025-03-07 14:52:36 105

原创 TCP/IP 5层协议簇:网络层(ICMP协议)

如下:和ip协议有关的才有ip头。

2025-03-06 11:13:02 380

原创 计算机网络基础:VLAN(虚拟局域网)

虚拟局域网:可以用来隔离广播广播和广播域:arp 出不了路由器,只能攻击内网路由器可以隔离广播(物理隔离)缺点是成本高、不灵活。

2025-03-06 10:53:25 427

原创 计算机网络基础:DNS 部署与安全

目录1. DNS2. 域名的组成3. DNS 服务器4. DNS 解析种类5. 安装DNS服务器6. 配置dns服务器7. 客户机指向dns服务器8. 反向解析过程9. 虚拟机上网介绍10. 别名11. 转发器如下:顶级域的表示:例子:端口号:TCP 53、DNS 53处理域名的顺序:先找缓存、看看是不是负责这种域名的解析、找转化器、找根客户机心理路程:1. 先看自己缓存2. 看 host 文件3. 寻求dns服务器帮助按照查询方式: 递归查询:所问所答

2025-03-05 09:11:07 978

原创 计算机网络基础:DHCP服务的部署

DHCP:动态分配IP地址(端口号是UDP 67/68)地址池、作用域:IP、子网掩码、网关、DNS、租期优点: DHCP租约过程,分为4个过程:dhcp 服务器的续约:可以部署dhcp的设备:windows、linux、三成交换机、路由器服务器的ip一定是静态的服务的位置:有的版本的服务器没有,需要用别的方式载入,下载个2003的镜像就行位置在这:安装后可以发现多了一个:对于服务器来说,安装了服务就会默认打开 右键新建作用域即可【当服务启动的时候,端口就在,停止服务的话,端口就会关闭】配置作用域:可以排除

2025-03-05 08:00:00 254

原创 计算机网络基础:文件共享服务器(注册表更改)

通过网络将文件共享给别人,提供文件的上传和下载【CIFS协议FTP协议是全球通用的,cifs是微软开发的服务:server,端口号445。

2025-03-04 13:06:47 182

原创 计算机网络基础:NTFS 安全权限

文件系统是在外部储存设备上组织文件的方法,其实就是存储格式格式化相当于在磁盘分区上制作文件系统、打格子的过程,放的文件越大,这里可以设置的大一点查看是否是NTFS的储存格式。

2025-03-04 08:30:00 200

原创 DenseUNet 改进:添加ASPP模块

​解决方案:ASPP通过并行空洞卷积(Dilated Convolution)​,以不同扩张率(Dilation Rate)提取多尺度特征,融合后增强模型感知能力。示例:扩张率18的3×3卷积,实际感受野为 ​**(18×2+1)×(18×2+1)=37×37**。​多尺度特征融合:通过不同扩张率,同时捕捉局部细节(小扩张率)和全局上下文(大扩张率)。4个并行卷积层,扩张率分别为 ​1, 6, 12, 18​(对应不同感受野)。​扩大感受野:空洞卷积在不增加参数量或下采样的前提下,扩大卷积核感受野。

2025-03-03 19:56:24 375

原创 UNet 改进:添加ASPP模块捕捉多尺度上下文信息

​(,空洞空间金字塔池化)是语义分割模型(如DeepLab系列)中的核心模块,旨在,提升模型对不同尺寸物体的分割效果。​​:图像中的物体尺寸差异大(如汽车 vs. 行人),传统卷积层难以同时捕捉多尺度特征。​:ASPP通过,以不同扩张率(Dilation Rate)提取多尺度特征,融合后增强模型感知能力。​ASPP模块由以下部分组成(以DeepLabv3为例):​4个并行卷积层,扩张率分别为 ​​(对应不同感受野)。每个分支含:空洞卷积 → 批量归一化(BN) → ReLU激活。

2025-03-03 16:33:51 428

原创 计算机网络基础:利用5次shift键漏洞破解用户密码

如下:有这个窗口就行重新启动,当出现这个界面,拔电源出现这个界面即可:没有的话,一直拔电源,开机就行修复取消:会出现这个界面:根据上面的目录,替换原有的5次shift的命令然后将cmd替换为5次shift键的程序,下面的名字(提前备份)重启即可:点击5次shift键更换密码:回车即可进入: 创新新用户:

2025-03-03 09:58:57 181

原创 计算机网络基础:服务器远程连接管理(Telnet命令)

输入对方的账户密码:新建用户的话,需要加入远程权限的组里。图形化远程连接:需要右键我的电脑,打开远允许程桌面连接。登录即可:需要把登录的用户加入下面的组里。3. 拥有远程管理权限(组)的用户。telnet的端口号:23。2. 服务器开了远程服务。1. 能ping 通。

2025-03-03 08:45:16 757

基于resnet网络和其改进对眼底疾病的分类任务,两只眼睛同时输入(6通道输入)

基于resnet网络和其改进对眼底疾病的分类任务,两只眼睛同时输入(6通道输入) 包含resnet18,34,50等以及在18上做的多尺度、se模块改进,评估指标有recall、precision、f1、acc等等

2025-04-05

医学图像分割数据集:小型胰腺图像语义分割数据集(约150张数据和标签)

医学图像分割数据集:小型胰腺图像语义分割数据集(约150张数据和标签) 【2类别的分割】:背景:0,1:胰腺(具体参考classes文件) 数据集介绍:【已经划分好】 训练集:images图片目录+masks模板目录,102张左右图片和对应的mask图片 验证集:images图片目录+masks模板目录,43张左右图片和对应的mask图片 除此之外,包含一个图像分割的可视化脚本,随机提取一张图片,将其原始图片、GT图像、GT在原图蒙板的图像展示,并保存在当前目录下 医学图像分割网络介绍:https://blog.youkuaiyun.com/qq_44886601/category_12102735.html 更多图像分割网络unet、swinUnet、trasnUnet改进,参考改进专栏:https://blog.youkuaiyun.com/qq_44886601/category_12803200.html

2025-04-05

深度学习基于SGESL模块的ResNet改进:增强语义特征提取与分类性能优化系统设计

内容概要:本文介绍了一种改进的深度学习模型——带有空间-语义增强模块(SGESL)的ResNet网络。SGESL模块通过引入语义分支和通道注意力机制来增强特征表达能力。具体实现上,SGESL模块首先通过两个卷积层提取语义特征,然后利用全局平均池化和全连接层计算通道权重,最后将加权后的特征与语义特征融合。BasicBlockWithSGESL作为残差块,在标准残差操作后加入SGESL模块。ResNetWithSGESL则基于ResNet架构,在每个阶段使用了带有SGESL的残差块。代码展示了模型的具体构建过程,并提供了一个简单的测试用例,验证了模型的正确性。; 适合人群:对深度学习有一定了解,特别是熟悉PyTorch框架和卷积神经网络的开发者或研究人员。; 使用场景及目标:①适用于需要提升图像分类性能的任务;②研究者可以在此基础上进一步优化模型或应用于其他计算机视觉任务;③开发者可以通过此代码学习如何在现有模型中集成新的模块以提高性能。; 阅读建议:建议读者先理解ResNet的基本结构和工作原理,再深入研究SGESL模块的设计思路及其在ResNet中的应用。同时,读者应具备一定的PyTorch编程经验,以便更好地理解和复现代码。

2025-04-05

医学图像分割数据集:眼底血管图像语义分割数据集(约48张数据和标签)

医学图像分割数据集:眼底血管图像语义分割数据集(约48张数据和标签) 【2类别的分割】:背景:0,1:眼底血管(具体参考classes文件) 数据集介绍:【已经划分好】 训练集:images图片目录+masks模板目录,34张左右图片和对应的mask图片 验证集:images图片目录+masks模板目录,10张左右图片和对应的mask图片 测试集:images图片目录+masks模板目录,4张左右图片和对应的mask图片 除此之外,包含一个图像分割的可视化脚本,随机提取一张图片,将其原始图片、GT图像、GT在原图蒙板的图像展示,并保存在当前目录下 医学图像分割网络介绍:https://blog.youkuaiyun.com/qq_44886601/category_12102735.html 更多图像分割网络unet、swinUnet、trasnUnet改进,参考改进专栏:https://blog.youkuaiyun.com/qq_44886601/category_12803200.html

2025-04-04

深度学习基于SimAM注意力机制的ResNet50模型改进:卷积神经网络图像分类性能提升

内容概要:本文介绍了SimAM注意力机制及其在ResNet架构中的应用。SimAM是一种轻量级的注意力模块,通过计算特征图中每个位置的重要性来增强模型的表现力。文中详细展示了SimAM模块的定义和前向传播过程,并将其集成到ResNet的Bottleneck模块中。整个ResNet网络由初始卷积层、四个残差阶段和分类头组成,支持可选的SimAM模块。最后,通过构建ResNet50-SimAM模型并进行前向传播测试,验证了模型的正确性和输出形状。; 适合人群:对深度学习尤其是卷积神经网络有一定了解的研究人员和工程师。; 使用场景及目标:①研究和理解SimAM注意力机制的工作原理;②将SimAM模块应用于其他基于ResNet的项目中;③改进现有模型的性能,特别是在视觉任务如图像分类上。; 阅读建议:本文涉及较多PyTorch代码实现细节,建议读者具备一定的PyTorch编程经验。对于SimAM模块的具体公式和参数设置,可以结合注释仔细研读,同时可以通过调整参数和实验进一步探索SimAM的效果。

2025-04-03

医学图像分割数据:基于超声左耳图像切片分割【包含3个切面的切片数据、标签文件、可视化代码】

医学图像分割数据:基于超声左耳图像切片分割【包含3个切面的切片数据、标签文件、可视化代码】 【其中mask中、0为背景,1为左耳朵等2类别】 数据集:分别从轴位面(横端面)、冠状面、矢状面切分出2D图像。为了方便分割,这里切片的时候去除了ROI区域不足1%的数据,并且做了Windowing增强。为了方便观察mask,提供了可视化代码(show.py) 数据集介绍:分为x、y、z轴的切面图像 x轴:images图片目录+masks模板目录,2546张图片和2546个对应的mask图片 y轴:images图片目录+masks模板目录,2295张图片和2295个对应的mask图片 z轴:images图片目录+masks模板目录,2324张图片和2324个对应的mask图片 【更多医学图像分割代码及改进,参考本人专栏:https://blog.youkuaiyun.com/qq_44886601/category_12858320.html】

2025-04-03

基于nii格式的超声左耳数据集+标签,3D数据

基于nii格式的超声左耳数据集+标签,3D数据,总共29个样本

2025-04-03

医学图像分割数据:大型CT脊椎切片分割(spinie)【包含3个切面的切片数据、标签文件、可视化代码】

医学图像分割数据:大型CT脊椎切片分割(spinie)【包含3个切面的切片数据、标签文件、可视化代码】 数据集:分别从轴位面(横端面)、冠状面、矢状面切分出2D图像。为了方便分割,这里切片的时候去除了ROI区域不足1%的数据。为了方便观察mask,提供了可视化代码(show.py) 数据集介绍:分为x、y、z轴的切面图像 x轴:images图片目录+masks模板目录,434张图片和434个对应的mask图片 y轴:images图片目录+masks模板目录,3432张图片和3432个对应的mask图片 z轴:images图片目录+masks模板目录,2398张图片和2398个对应的mask图片 【更多医学图像分割代码及改进,参考本人专栏:https://blog.youkuaiyun.com/qq_44886601/category_12858320.html】

2025-04-03

37张人体脊椎的3D数据和标签

37张人体脊椎的3D数据和标签,nii格式

2025-04-03

基于resnet、swin-transformer、mobilenetv4实现的图像分类项目

基于resnet、swin-transformer、mobilenetv4实现的图像分类项目。包含三个项目,其中resnet、swin-transformer分为不同的版本,同时加入了recall、f1、precision等指标

2025-04-02

基于 MobileUnet现的医学图像语义分割项目:人体腹部脊椎块分割【含热力图可视化、完整结果】

数据集采用【人体腹部脊椎块分割,dice约为0.93,iou为0.88,训练了50个epoch】,数据在data目录下,划分了训练集和验证集。【代码可一键运行】 【介绍】分割网络为MobileUnet和EfficientUnet(可以自行选择),学习率采用cos余弦退火算法。如果想在大尺度进行训练,修改base-size参数即可,优化器采用了AdamW。评估的指标为dice、iou、recall、precision、f1、pixel accuracy等等,代码会对训练和验证集进行评估,结果保存runs下的json文件中。 网络推理的时候,会自动将inference/img下所有图像进行推理,并且保存在infer_get、show下,前者是推理gt阈值图像,后者是img+推理gt的掩膜效果,heatmap下是推理生成的热力图 更多医学图像语义分割实战:https://blog.youkuaiyun.com/qq_44886601/category_12816068.html

2025-04-02

【深度学习、图像识别】基于PPA模块的UNet图像分割模型设计:多尺度特征融合与注意力机制应用

内容概要:本文介绍了一种改进的UNet架构——PPA_UNet,该网络主要用于图像分割任务。PPA_UNet在传统UNet的基础上引入了金字塔池化注意力(PPA)模块,以增强对不同尺度特征的捕捉能力。PPA模块通过多尺度池化、卷积操作以及注意力机制对输入特征进行处理,最终将加权后的特征与原始特征融合并通过卷积层输出。PPA_UNet的编码器部分由四个连续的编码块组成,每个编码块后接一个PPA模块;解码器部分则采用跳跃连接的方式将编码器中的特征与解码器特征相结合。最后,通过一个卷积层生成最终的分割结果。; 适合人群:熟悉PyTorch框架并对图像分割领域有一定了解的研究人员或工程师。; 使用场景及目标:①适用于需要提高图像分割精度,尤其是处理多尺度对象的场景;②研究者可以基于此模型进行改进,探索更高效的特征提取方法;③工程师可以将其应用于医学影像分析、遥感图像处理等领域。; 阅读建议:本文代码实现了PPA_UNet的具体细节,建议读者先理解UNet的基本原理,再深入研究PPA模块的设计思想及其在编码器和解码器中的应用。同时,可以通过调整超参数如池化尺寸、通道数等来优化模型性能。

2025-04-02

MobileNet V3 模型实现的迁移学习、计算机视觉识别实战:Flyai新冠分类【可一键运行】

该项目是一个基于MobileNet V3模型的图像分类系统,旨在通过深度学习技术实现高效的图像分类任务。系统主要由三个模块组成:模型训练、推理预测和工具函数。首先,train.py脚本负责模型的训练过程,用户可以通过命令行参数设置模型类型、优化器、学习率、批量大小等超参数。训练过程中,脚本会自动进行数据预处理、模型初始化、训练与验证循环,并保存最佳模型权重和训练日志。训练结束后,系统会生成损失曲线、准确率曲线、混淆矩阵、recall、F1、precision、ROC曲线和AUC值等可化结果,帮助用户评估模型性能。 其次,infer.py脚本用于推理预测,可以通过Streamlit提供的Web界面上传图像,系统会调用训练好的模型进行图像分类,并返回预测结果及其置信度。本项目没有训练,可以自行训练 关于AI改进参考:https://blog.youkuaiyun.com/qq_44886601/category_12858320.html

2025-04-01

基于resnet、vision-transformer、yolo11实现的对X射线下的种植牙齿检测

基于resnet、vision-transformer、yolo11实现的对X射线下的种植牙齿检测,包含数据集、完整代码、训练结果等

2025-04-01

针对于opencv实现的实时停车位空余检测

针对于opencv实现的实时停车位空余检测,包含脚本、数据和测试视频,一次执行脚本1、2、3即可

2025-04-01

4种生活中垃圾分类(2600多张数据集,包含有害垃圾、厨余垃圾、其他垃圾、可回收垃圾)

4种生活中垃圾分类(2600多张数据集,包含有害垃圾、厨余垃圾、其他垃圾、可回收垃圾)

2025-03-30

基于Denseunet在医学细胞的多分割完整项目

基于Denseunet在医学细胞的多分割完整项目,指标如下: global correct: 0.9243 precision: ['0.9514687657356262', '0.783207893371582', '0.795860767364502', '0.7767999768257141', '0.7432000041007996'] recall: ['0.9605168700218201', '0.7945777177810669', '0.7672172784805298', '0.7871999740600586', '0.6715999841690063'] Dice: ['0.9559999704360962', '0.7904000282287598', '0.7807000279426575', '0.7820000052452087', '0.7074000239372253'] Jaccard: ['0.9157087802886963', '0.6534391641616821', '0.6402854323387146', '0.6420361399

2025-03-30

基于ResUNet和Unet在BS乳腺癌症数据集上的分割系统,包含项目说明

基于ResUNet和Unet在BS乳腺癌症数据集上的分割系统,包含项目说明 项目包含数据集和完整代码以及训练结果,并且包含了一份word的项目说明,可以直接使用

2025-03-30

医学图像分类数据集: x射线下的种植牙齿图像分类【包括划分好的数据、类别字典文件、python数据可视化脚本】

医学图像分类数据集: x射线下的种植牙齿图像分类【包括划分好的数据、类别字典文件、python数据可视化脚本】 【分类个数】{ "0": "A", "1": "O", "2": "T" }等3类 【数据集详情】data目录下分为2个目录,train为训练集、val为验证集,存放各自的同一类数据图片。train数据总数1700,test数据总数740。可以用作yolov5的分类数据集. 【json文件】3种分类的字典文件 为了方便查看数据,提供了可视化py文件,随机传入4张图片即可展示,并且保存在当前目录。 脚本无需更改,可以直接运行!

2025-03-30

目标检测数据集:(基于X射线下的种植牙齿型号分类)目标图像检测数据【VOC标注格式、包含数据和标签】

目标检测数据集:(基于X射线下的种植牙齿型号分类)目标图像检测数据【VOC标注格式、包含数据和标签】 数据保存按照文件夹保存,经测试,可直接用作目标检测数据集,无需额外处理。 【数据集详情】共2600张左右数据和对应的xml标注文件,类别请查看classes文件: { "0": "T", "1": "O", "2": "A" } 关于yolo实战检测教程:https://blog.youkuaiyun.com/qq_44886601/article/details/134878776 yolov5的改进实战:https://blog.youkuaiyun.com/qq_44886601/category_12605353.html

2025-03-30

PYTHON游戏开发:基于图形和音效的童年经典游戏开发:坦克大战

PYTHON游戏开发:基于图形和音效的童年经典游戏开发:坦克大战,包含音频、图像、代码,运行主函数即可

2025-03-28

基于卷积神经网络的猫狗分类轻量化模型,参数8比特定点,模型不足100kb

基于卷积神经网络的猫狗分类轻量化模型,参数8比特定点,模型不足100kb,包含数据集,train和infer脚本

2025-03-26

基于 Resnet 融合CBAM改进实战项目: 结肠癌组织病理学图像分类

【分类介绍】 网络采用resnet家族系列,包括resnet18、34、50、101、152系列 1.训练的时候根据需要进行迁移学习或者只训练分类层;为了做对比消融试验,优化器采用了Adam和SGD,也可以自行添加;损失函数采用多类别的交叉熵、学习率优化策略采用cos余弦退火算法 2. 验证集的评估会在训练同时完成,训练脚本会对训练集和验证集同时评估,指标有loss、准确率、混淆矩阵、recall、precision、F1 score、特异度等,并返回对应的曲线图像。也可以根据个人需要绘制不同曲线,请参考训练日志json文件 3. 推理的时候将图片放在指定目录即可 4. 想要更换数据集,参考readme文件,按照要求摆放好数据即可 【改进】 代码在resnet每个layer后加入了CBAM模块,可以根据需要只在某个layer后添加,注释掉其他的即可。为了方便,想要更好别的模块,只需要将CBAM替换即可 本项目数据集为2种结肠癌组织分类 更多分类、分割改进:https://blog.youkuaiyun.com/qq_44886601/category_12803200.html

2025-03-26

医学图像分类数据集: 结肠癌组织病理学图像分类【包括划分好的数据、类别字典文件、python数据可视化脚本】

医学图像分类数据集: 结肠癌组织病理学图像分类【包括划分好的数据、类别字典文件、python数据可视化脚本】 【分类个数】{ "0": "Colon adenocarcinoma", "1": "Colon benign tissue" }等2类 【数据集详情】data目录下分为2个目录,train为训练集、test为测试集,存放各自的同一类数据图片。train数据总数7000,test数据总数3000。可以用作yolov5的分类数据集. 【json文件】2种分类的字典文件 为了方便查看数据,提供了可视化py文件,随机传入4张图片即可展示,并且保存在当前目录。 脚本无需更改,可以直接运行!

2025-03-26

医学图像分类数据集: 肺癌组织病理学图像分类【包括划分好的数据、类别字典文件、python数据可视化脚本】

医学图像分类数据集: 肺癌组织病理学图像分类【包括划分好的数据、类别字典文件、python数据可视化脚本】 【分类个数】{ "0": "lung_aca", "1": "lung_n", "2": "lung_scc" }等3类:Lung benign tissue 肺良性组织、Lung adenocarcinoma 肺腺癌、Lung squamous cell carcinoma 【数据集详情】data目录下分为2个目录,train为训练集、test为测试集,存放各自的同一类数据图片。train数据总数10500,test数据总数4500。可以用作yolov5的分类数据集. 【json文件】3种分类的字典文件 为了方便查看数据,提供了可视化py文件,随机传入4张图片即可展示,并且保存在当前目录。 脚本无需更改,可以直接运行!

2025-03-26

基于对细胞中线粒体(ch2)、细胞核(ch3)、内质网(ch4)、溶酶体(ch5)数据集中的不良数据的筛选项目

要求如下:对四个颜色通道里的所有图像进行筛选,精确去除…… 1)包含细胞器形态学不合格(后述)的图像 2)不包含任何有意义细胞器的图像 3)包含模糊(即失焦)细胞器的图像 4)平场矫正后对比度仍然不理想的图像 代码中有不同细胞的参数列表,参考如下: 每个通道(ch2/ch3/ch4/ch5)有共同的基础参数和特有参数: 参数名 默认值/范围 功能说明 min_area 30-150 细胞器的最小像素面积,低于此值视为无效 blur_threshold 45-60 越高对焦要求越严格 contrast_threshold 0.011-0.015 平场矫正后的对比度标准差阈值,值越低允许的对比度越差,允许的对比度下限 edge_exclusion 0.1 图像边缘排除比例(10%) 忽略图像边缘10%的区域 仅ch4(特有参数 ) shape_threshold 0.7 内质网形态规则性阈值(越低允许的形状越不规则) solidity_threshold 0.7 细胞粘连检测阈值(轮廓面积/凸包面积比),低于此值视为细胞粘连

2025-03-25

基于Swin-Transformer系列下的神经网络模型实现的迁移学习项目实战: 棉花植株病害分类

【项目简介】 代码主干网络采用Swin-Transformer 家族系列,包括【tiny、small、base】三种模型。pretrained和freeze_layers参数为是否采用官方预训练模型和是否仅训练分类头。为了做对比消融试验,优化器采用了Adam和SGD、AdamW三种。损失函数采用多类别的交叉熵、学习率优化策略采用cos余弦退火算法 【评估网络】 评估的指标采用loss和准确率(accuracy),分别会在训练集和验证集上进行评估、输出、绘制曲线图像。同时会在训练集、验证集进行一系列评估,包含混淆矩阵、recall、precision、F1 score等等曲线图像,以及recall、precision、F1 score、特异度的输出信息等等。 【具体各类别的指标在json文件中查看】 【如果想要更换数据集训练,参考readme文件】 【本项目为6种棉花植株病害图片,包含数据集和标签,可以一键运行】 关于swin的改进:https://blog.youkuaiyun.com/qq_44886601/category_12858320.html

2025-03-25

基于整张苹果叶片病害分割数据集【包含数据集、标签文件、可视化代码】

基于整张苹果叶片病害分割数据集【包含数据集、标签文件、可视化代码】 数据集为256*256分辨率下的苹果叶片病害分割。总共有4个文件夹,分别为四种桧胶锈病、健康、黑腐病、斑点病数据集(这里分开保存在不同目录中),以及对应的mask模版。分割的mask采用rgb的彩色标注文件,背景为黑色 数据集介绍:总共6342张图像和对应的标签

2025-03-24

基于transformer和SwinUNet卷积神经网络对MoNuSAC细胞的图像分割

基于transformer和SwinUNet卷积神经网络对MoNuSAC细胞的图像分割,包含数据集和完整代码,评估指标采用dice、iou、recall、precision等等。代码可以一键运行

2025-03-24

计算机视觉项目:Shufflenet V2 模型实现的图像识别项目:小麦植物病害识别

该项目是一个基于ShuffleNetV2模型的图像分类系统,旨在通过深度学习技术实现高效的图像分类任务。系统主要由三个模块组成:模型训练、推理预测和工具函数。首先,train.py脚本负责模型的训练过程,用户可以通过命令行参数设置模型类型、优化器、学习率、批量大小等超参数。训练过程中,脚本会自动进行数据预处理、模型初始化、训练与验证循环,并保存最佳模型权重和训练日志。训练结束后,系统会生成损失曲线、准确率曲线、混淆矩阵、recall、F1、precision等可视化结果,帮助用户评估模型性能。 其次,infer.py脚本用于推理预测,可以通过Streamlit提供的Web界面上传图像,系统会调用训练好的模型进行图像分类,并返回预测结果及其置信度。推理过程中,脚本会加载预训练的模型权重和标签文件,对输入图像进行预处理,并通过模型计算输出分类结果。Streamlit的交互式界面使得推理过程更加直观和用户友好。 本项目可以一键运行,关于AI改进参考:https://blog.youkuaiyun.com/qq_44886601/category_12858320.html

2025-03-24

图像分类数据集: 小麦植物病害图像分类【包括划分好的数据、类别字典文件、python数据可视化脚本】

图像分类数据集: 小麦植物病害图像分类【包括划分好的数据、类别字典文件、python数据可视化脚本】 【分类个数】{ "0": "Aphid", "1": "Black Rust", "2": "Blast", "3": "Brown Rust", "4": "Common Root Rot", "5": "Fusarium Head Blight", "6": "Healthy", "7": "Leaf Blight", "8": "Mildew", "9": "Mite", "10": "Septoria"}等14类 【数据集详情】data目录下分为2个目录,train为训练集、test为测试集,存放各自的同一类数据图片。train数据总数13000,test数据总数750。可以用作yolov5的分类数据集. 【json文件】14种分类的字典文件 为了方便查看数据,提供了可视化py文件,随机传入4张图片即可展示,并且保存在当前目录。 脚本无需更改,可以直接运行!

2025-03-24

目标检测数据集:(x射线胸部结核病)目标图像检测数据【VOC标注格式、包含数据和标签】

目标检测数据集:(x射线胸部结核病)目标图像检测数据【VOC标注格式、包含数据和标签】 数据保存按照文件夹保存,经测试,可直接用作目标检测数据集,无需额外处理。 【数据集详情】共800张左右数据和对应的xml标注文件,类别请查看classes文件: { "0": "ObsoletePulmonaryTuberculosis", "1": "ActiveTuberculosis" } 关于yolo实战检测教程:https://blog.youkuaiyun.com/qq_44886601/article/details/134878776 yolov5的改进实战:https://blog.youkuaiyun.com/qq_44886601/category_12605353.html

2025-03-24

计算机视觉项目:VGG神经网络(vgg11、vgg13、vgg16等)实现的迁移学习、图像识别:x射线胸部疾病

【项目简介】 代码主干网络采用VGG家族系列,包括vgg11、vgg13、vgg16、vgg19等模型。训练的时候是否需要载入官方在imageNet数据集上的预训练权重或者仅仅训练分类输出层,只需要更改pretrained和freeze_layers参数即可。为了做对比消融试验,优化器采用了Adam和SGD两种,如果需要增加其他的,可以自行在if语句中添加。损失函数采用多类别的交叉熵、学习率优化策略采用cos余弦退火算法 【评估网络】 评估的指标采用loss和准确率(accuracy),分别会在训练集和验证集上进行评估、输出、绘制曲线图像。同时会在训练集、验证集进行一系列评估,包含混淆矩阵、recall、precision、F1 score等等曲线图像,以及recall、precision、F1 score、特异度的输出信息等等。 【具体各类别的指标在json文件中查看】 【how to train】 仅仅将数据集按照本项目的参考猫狗数据集摆放即可,参考readme文件,不需要更改参数!! 【本项目为3种x射线胸部疾病图片分类 (约8.5k数据),包含数据集和标签,可以一键运行】

2025-03-24

医学图像分类数据集: 基于X 射线大规模结核病图像分类【包括划分好的数据、类别字典文件、python数据可视化脚本】

图像分类数据集: 基于X 射线大规模结核病图像分类【包括划分好的数据、类别字典文件、python数据可视化脚本】 【分类个数】{ "0": "health", "1": "sick", "2": "tuberculosis" } 【数据集详情】data目录下分为2个目录,train为训练集、test为测试集,存放各自的同一类数据图片。train数据总数5880,test数据总数2500。可以用作yolov5的分类数据集. 【json文件】3 种分类的字典文件 为了方便查看数据,提供了可视化py文件,随机传入4张图片即可展示,并且保存在当前目录。 脚本无需更改,可以直接运行!

2025-03-24

医学图像分割数据集:4种显微镜下的细胞目标图像语义分割数据集(约1000张数据和标签)

医学图像分割数据集:4种显微镜下的细胞目标图像语义分割数据集(约1000张数据和标签) 【5类别的分割】:背景:0 上皮细胞:1 淋巴细胞:2 中性粒细胞:3 巨噬细胞:4(具体参考classes文件 ) 数据集介绍:【已经划分好】 训练集:images图片目录+masks模板目录,737张左右图片和对应的mask图片 验证集:images图片目录+masks模板目录,315张左右图片和对应的mask图片 除此之外,包含一个图像分割的可视化脚本,随机提取一张图片,将其原始图片、GT图像、GT在原图蒙板的图像展示,并保存在当前目录下 医学图像分割网络介绍:https://blog.youkuaiyun.com/qq_44886601/category_12102735.html 更多图像分割网络unet、swinUnet、trasnUnet改进,参考改进专栏:https://blog.youkuaiyun.com/qq_44886601/category_12803200.html

2025-03-23

基于双侧骶髂关节强直性脊柱炎的swinUNet、resunet、unet分割实验对比

基于双侧骶髂关节强直性脊柱炎的swinUNet、resunet、unet分割实验对比,包含数据集和完整代码,可以一键运行 评估指标有dice、iou、recall、precision、特异度曲线等等

2025-03-23

基于DenseNet121,161,169,201等模型实现的迁移学习识别项目实战:8种眼底疾病识别

【项目简介】 代码主干网络采用DenseNet家族系列,包括densenet121,161,169,201模型。训练的时候是否需要载入官方在imageNet数据集上的预训练权重或者仅仅训练分类输出层,只需要更改pretrained和freeze_layers参数即可。为了做对比消融试验,优化器采用了Adam和SGD两种,如果需要增加其他的,可以自行在if语句中添加。损失函数采用多类别的交叉熵、学习率优化策略采用cos余弦退火算法 【评估网络】 评估的指标采用loss和准确率(accuracy),分别会在训练集和验证集上进行评估、输出、绘制曲线图像。同时会在训练集、验证集进行评估,包含混淆矩阵、recall、precision、F1 score等等曲线图像,以及recall、precision、F1 score、特异度的输出信息等等。 【如果想要更换数据集训练,参考readme文件】 【本项目为8种眼底疾病识别(约5k张数据),包含数据集和标签,可以一键运行】

2025-03-23

基于transformer和unet卷积神经网络对心脏左心室分割的研究、已经训练完成

基于transformer和unet卷积神经网络对心脏左心室分割的研究、已经训练完成 本项目通过transformer和unet对心脏左心室的分割对比,意图在transunet进行改进,实现的方式为添加了SE模块和CBAM模块。本项目总共训练了三个模型,分别为unet、transformer-SE-Unet、transformer-CBAM-unet,dice和iou指标均超过0.9,效果不错。为了可视化推理,infer脚本可以进行本地的网页端推理,上传图片即可,项目已经封装好。 具体的dice、iou、precision、recall等指标在runs下查看

2025-03-21

基于pytorch实现的ghostnetv1、v2、v3对11种生活风景场景、建筑识别【完整代码+数据集】

代码经过测试,可以直接运行,如果想要训练自己数据集,按照readme摆放好数据即可,不用做别的操作。 【网络】ghost(v1、v2、v3) 【数据集】生活风景场景、建筑识别(约1100张数据) 训练脚本(train)在参数中可以选择不同的ghost网络,分为ghost v1、ghost v2、ghost v3三种。优化器可以在SGD、Adam中选择。训练过程中,会生成最好和最后的两个权重,训练和验证集的loss、acc曲线,以及训练日志等等。 验证脚本(val)传入测试集,可以计算混淆矩阵、recall、precision、F1分数等等。

2025-03-20

基于甲状腺结节良恶性识别的实验探究【包含多个分类模型和改进】

基于甲状腺结节良恶性识别的实验探究【包含多个分类模型和改进】,包含ConvNeXt、SwinTransformer、Vgg、VisionTransformer完整分类模型,以及resnet基于SE和CBAM改进的对比实验,数据集在data目录下

2025-03-20

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除