- 博客(428)
- 收藏
- 关注

原创 Unet 实战分割项目、多尺度训练、多类别分割
之前写了篇二值图像分割的项目,支持多尺度训练,网络采用backbone为vgg的unet网络。本章实现的unet网络的多类别分割,也就是分割可以是两个类别,也可以是多个类别。训练过程仍然采用多尺度训练,即网络会随机将图片缩放到设定尺寸的0.5-1.5倍之间。
2024-02-05 21:38:35
7099
11
原创 K-means算法
通俗版 K-means 解释想象一下,你是一个教练,现在有一群人需要分成K 个队伍。你的任务就是合理分组,让每个队伍内部的人尽可能相似(比如身高相近、兴趣相似等)。具体步骤是这样的:随机选队长:你随便指定K 个人作为初始的“队长”(也就是聚类中心第一次站队:每个人观察自己和哪个队长最接近(比如距离最近),然后站到对应的队伍里。队长重新调整位置:每个队伍的队长不能一直原地不动,于是你让他们移动到当前队伍成员的平均位置(也就是新的中心点)。重新站队:大家再次看看自己离哪个新队长最近,调整队伍。重复调整。
2025-04-02 16:38:42
761
原创 UNet 改进:添加PPA 2024多分支特征提取策略详解
多分支特征提取(Multi-Branch Feature Extraction)是PPA(Pyramid Pooling Attention)2024改进的核心模块,旨在通过。:通过交叉注意力(Cross-Branch Attention)或特征图拼接+1×1卷积实现信息交互。:动态权重机制使模型灵活应对不同输入(如纹理复杂区域激活局部分支,平滑区域依赖全局分支)。:通过轻量级全连接层或SE模块生成各分支的权重,实现动态特征融合。:设计辅助损失函数(如分支特征一致性约束),避免分支退化。
2025-04-02 10:03:53
19
原创 基于openCV的停车场实时车位空余检测
观察检测的效果图,发现车位检测出来了,但是车位的位置不太对因为本文的图片是从一张大图中截取的,因此图像和视频的尺寸对不上,应用中使用相同的标注图像和视频文件即可当然,也可以在图像和视频检测前加一个resize,最后实时监测的时候在resize回去即可。
2025-04-01 09:15:32
264
原创 VGG 改进:添加RFAConv模块优化特征冗余
是一种结合多尺度卷积与双注意力机制(通道+空间)的动态特征增强模块,旨在解决传统卷积层中特征冗余问题,提升模型的特征表示能力。其核心设计思想是通过多分支感受野提取不同尺度的上下文信息,并通过注意力机制动态校准特征重要性,最终实现高效的特征融合。以下从模块结构、关键组件及作用原理进行详细解析。RFAConv的整体结构分为四个核心部分(结构示意图如下):输入 → [多尺度卷积分支] → 特征融合 → [通道注意力] → [空间注意力] → 残差连接 → 输出。
2025-04-01 08:28:21
103
原创 ResNet改进:SE模块和多尺度模块两次改进
SE(Squeeze-and-Excitation)模块是一种轻量级的注意力机制,最初由Momenta和牛津大学的研究者在2017年提出,并在2018年的CVPR会议上发表。它通过显式建模通道间的相互依赖关系,自适应地重新校准通道特征响应,显著提升了多种卷积神经网络的性能。核心思想SE模块的核心思想是让网络能够学习到不同通道特征的重要性,并据此增强有用特征、抑制无用特征。:压缩空间信息,获取全局感受野:学习通道间的相关性,生成每个通道的权重结构组成。
2025-03-30 17:04:44
38
原创 基于pygame实现的吃豆人游戏代码
吃豆人(Pac-Man)是1980年代风靡全球的街机游戏,其核心玩法简单却充满策略性。本文将基于Python的Pygame库,解析一个完整实现的吃豆人游戏代码。(每次游戏不同)(A*算法实现)(幽灵恐惧状态)(生命值、得分、胜负判定)
2025-03-26 15:50:54
602
原创 VGG 改进:添加ScConv空间与通道特征重构卷积
或更复杂的融合方式如:F_out = Conv1×1(Concat[A_s ⊗ F_in, A_c ⊗ F_in])ScConv 将空间和通道重构有机结合:F_out = A_s ⊗ F_cr + F_in。通过残差连接保留原始信息:F_sr = Conv1×1(F_s) + F_in。形成空间注意力图:A_s = σ(Conv(F_sr)),σ为sigmoid。公式表示:F_s = DWConv(F_in),其中DWConv为深度卷积。将通道权重应用于特征图:F_cr = A_c ⊗ F_in。
2025-03-25 09:30:17
207
原创 基于python脚本实现的打砖块小游戏
球:定义球的半径。ball_x和ball_y:定义球的初始位置,使其位于屏幕中央。和:定义球在水平和垂直方向上的速度。
2025-03-24 13:42:44
816
原创 ResNet 改进:加入Transformer模块
这个类继承了ResNet-34,并在ResNet-34的最后一个卷积层之后添加了Transformer模块。在ResNet-34中添加Transformer模块可以通过在网络的某个位置插入Transformer层来实现。方法中,输入首先通过ResNet-34,然后通过Transformer模块,最后通过全局平均池化和全连接层。: 这是一个简单的Transformer编码器模块,包含多个Transformer编码器层。:与 RNN 不同,Transformer 可以并行处理整个序列,训练速度更快。
2025-03-24 09:24:46
321
原创 第16章:基于CNN和Transformer对心脏左心室的实验分析及改进策略
Encoder部分主要利用Transformer的自注意力机制来提取图像的全局特征,而Decoder部分则类似于UNet的解码器,用于将特征映射回原始图像的分辨率并生成分割结果。在训练过程中,Unet通过将输入图像与对应的标签图像一起输入网络,利用损失函数计算网络输出与标签之间的差异,并通过反向传播算法调整网络参数,使得网络输出能够尽可能地接近标签图像。总的来说,TransUNet模型是一种结合了Transformer和UNet特点的先进图像分割模型,适用于医学图像等领域的任务。
2025-03-21 13:17:31
889
原创 关于深度学习的梯度下降法介绍
梯度下降法是机器学习中用于优化模型参数的核心算法。理解梯度的概念、掌握梯度下降法的基本步骤,并了解其潜在问题及解决方案,是掌握这一“黑魔法”的关键。通过合理选择学习率、使用优化算法的变体以及应对局部最小值和鞍点问题,可以显著提高梯度下降法的性能,从而更有效地训练神经网络。
2025-03-20 15:51:45
835
1
原创 DenseNet 改进:ODConv2d全维动态卷积替换卷积层
(Omni-Dimensional Dynamic Convolution,全维动态卷积)是一种创新的卷积操作,旨在通过多维度动态机制提升卷积神经网络的表达能力。它是对传统卷积(如标准卷积、动态卷积 CondConv 和 DyConv)的进一步扩展,能够在多个维度上动态调整卷积核的参数,从而更好地适应输入特征的变化。然而,现有的动态卷积方法通常只在单一维度(如通道维度)上引入动态机制,未能充分利用输入特征的多维度信息。相比传统的静态卷积和单一维度的动态卷积,ODConv2d 具有更强的灵活性。
2025-03-20 11:18:09
42
1
原创 Vgg 改进:添加ShuffleAttention模块增强跨通道交互能力
ShuffleAttention 是一种结合了通道注意力机制与通道混洗操作的模块,能够增强特征表达能力并促进组间信息交互。其中 W1∈RCG×CG⋅r, W2∈RCG⋅r×CG,r 为压缩比。本文 ShuffleAttention 模块 加入的位置在每次下卷积后。:对每组特征分别进行通道注意力计算(类似SE模块)。:重组通道使得不同组的信息能够交互。使用全局平均池化获取通道统计量。操作重组通道,促进跨组信息交换。:将输入特征图按通道分为G组。组,每组独立计算注意力权重。
2025-03-19 10:02:56
29
原创 基于图像处理和机器学习实现的压差表数值读取
目录1. 项目概述2. 算法实现3. 项目目录4. 效果展示5.代码在本章中,将详细介绍如何通过一系列步骤对压差表图像进行数字图像处理并准确读出其刻度值。包含从环境搭建到图像预处理,再到指针识别与刻度读取和存储的全过程。主要包括下面几个步骤:算法首先对输入的压差表图像进行灰度处理,由此可以简化信息,提高处理速度,更加清晰地观察到图像中的关键特征,并为后续的模板匹配和指针识别提供便利。在灰度处理的基础上,利用FLANN(快速最近邻搜索库、SIFT尺度不变性等)匹配器进行模板匹配,快速定位仪表位置,确保后续识
2025-03-18 13:36:33
447
原创 SwinTransformer 改进:添加DoubleAttention模块提升上下文语义提取能力
是一种用于计算机视觉任务的注意力机制,旨在通过双重注意力机制增强特征表示。:关注特征图中哪些空间位置(spatial location)更重要。通过结合这两种注意力机制,模型可以更全面地捕捉特征图中的重要信息。:将通道注意力和空间注意力的结果融合,得到最终的特征表示。模块的核心思想是通过两种不同的注意力机制(通常是。对特征图的每个空间位置进行加权,增强重要位置的特征。:关注特征图中哪些通道(channel)更重要。对特征图的每个通道进行加权,增强重要通道的特征。:输入特征图经过卷积层提取特征。
2025-03-18 09:25:37
447
7
原创 基于Pygame实现2048小游戏
2048是一款风靡全球的数字益智游戏,玩家通过滑动方向键合并相同数字,最终目标是合成"2048"这个数字。本文将使用Python的Pygame库实现该游戏的图形化版本,包含分数统计、动画效果和游戏结束判断等核心功能。本实现完整还原了2048的核心玩法,可以通过以下方式扩展:添加音效和更流畅的动画实现撤销功能增加AI自动求解模块支持不同尺寸的网格(5x5、6x6)通过这个项目,可以学习到:Pygame的基本使用二维数组操作技巧游戏状态管理方向键事件处理。
2025-03-17 13:19:47
529
原创 第15章:ConvNeXt图像分类实战:遥感场景分类【包含本地网页部署、迁移学习】
它通过借鉴Transformer的设计思想,对传统CNN进行了改进,使其在图像分类等任务中表现优异,甚至超越了Vision Transformers(ViT)ConvNeXt 实现的model部分代码如下面所示,这里如果采用官方预训练权重的话,会自动导入官方提供的最新版本(ImageNet)的权重。:使用更大的卷积核(如7x7)来扩大感受野,类似于Transformer中自注意力机制捕捉全局信息的能力。:借鉴MobileNetV2的倒置瓶颈设计,先扩展通道数再进行深度卷积,最后压缩通道数,提升计算效率。
2025-03-16 20:00:25
984
原创 MobileNet 改进:添加inception模块
Inception 模块通过并行使用 1x1、3x3 和 5x5 卷积核,以及最大池化操作,能够在同一层级上提取不同尺度的特征。传统的卷积网络通常只使用单一尺寸的卷积核(如 3x3 或 5x5),这可能会限制网络捕捉不同尺度特征的能力。不同分支提取的特征在通道维度上拼接(concatenate),形成丰富的多尺度特征表示。先使用 1x1 卷积降维,然后使用 3x3 卷积提取中等尺度的特征。先使用 1x1 卷积降维,然后使用 5x5 卷积提取大尺度的特征。,从而捕捉不同尺度的特征信息。
2025-03-13 12:42:32
150
原创 计算机网络基础:NAT 网络地址转换
NAT:Network Address Translations网络地址转换,解决IP地址不够用的问题公网和私网:私有ip范围:工作设备:1. 静态NAT2. 动态NAT3. PAT静态NAT :只能有一个上网动态NAT :需要三个人抢PAT(port)端口地址转换、端口复用技术:将ip转换成端口号,真正区分内网通过端口号1. 当内网ip访问百度的时候,路由器对地址池进行对比,成功的话将内网访问的端口进行映射(5000--->1)。然后到公网上就变成,路由器用自己公网IP的1端口进行访问2. 百度回包的时候
2025-03-13 11:15:05
331
原创 UNet 改进:添加Transformer注意力机制增强捕捉长距离依赖关系的能力
每个注意力头计算每个输入元素相对于其他元素的重要性,使模型能够专注于输入序列的不同方面。总体而言,TransformerBlock在Transformer模型架构的成功中起着至关重要的作用,并为自然语言处理任务的进步做出了重大贡献。TransformerBlock因其能够捕获序列中的长程依赖关系、并行性以及在处理不同语言对和自然语言处理任务方面的有效性而广受欢迎。这有助于捕捉序列中的复杂模式和关系。然后,前馈神经网络的输出通过残差连接和层归一化,这有助于稳定训练过程并改善训练过程中的梯度流。
2025-03-12 13:32:38
891
原创 计算机网络基础:PKI(公钥基础设施)
签名:123为公钥,321为私钥。发送的时候用321签名,123解密能解开说明数据正确。数字签名:传输者将哈希值用其私钥加密所得的加密哈希值。数字签名:传输者将哈希值用其私钥加密所得的加密哈希值。
2025-03-11 10:57:08
184
1
原创 计算机网络基础:IIS服务器(FTP服务器)
ftp服务器一般不允许匿名访问,web可以匿名访问。21控制端口、20数据端口。设置权限:和共享一样。
2025-03-10 10:21:58
311
1
原创 计算机网络基础:IIS服务器(WEB服务器)
web服务器也被称为网页服务,或者http服务器。WEB服务器使用的协议是HTTP或者HTTPS。服务器更改:不要使用1000以下的,会被使用。默认的网站在这:要是停止的话,就不能访问。一个服务器可能有多个网卡,需要自己指定。这时候端口号已经打开了,可以访问了。同理创建网站的时候,ip会冲突。不能和用户互动的都是静态网页。客户机访问:需要指定DNS。客服机访问:改变端口号。在DNS不同区域建立。
2025-03-10 09:33:53
670
原创 Vgg 改进:添加TripletAttention模块减少冗余计算
TripletAttention 是一种用于计算机视觉任务的注意力机制,旨在减少冗余计算和同时存储访问,从而提高模型的效率和性能。它通过引入三元组(Triplet)结构来优化注意力机制的计算过程。核心思想:TripletAttention 的核心思想是通过将输入特征图分成三个部分(即三元组),并在每个部分上分别计算注意力权重,从而减少计算复杂度和存储访问的冗余。具体来说,TripletAttention 将输入特征图分为三个通道组,并在每个组上独立计算注意力权重,最后将这些权重合并以生成最终的注意力图。
2025-03-09 19:10:54
170
原创 ResNet 改进:轻量级的混合本地信道注意机制MLCA
2. 全局信道注意力(Global Channel Attention):全局信道注意力则关注整个特征图的全局信息,通过对每个信道进行全局加权,捕捉全局上下文信息。1. 局部信道注意力(Local Channel Attention):局部信道注意力关注于特征图的局部区域,通过对每个信道进行局部加权,捕捉局部细节信息。MLCA是一种轻量级的混合本地信道注意机制,通过结合局部和全局信道注意力,能够在保持较低计算复杂度的同时,提升特征表示能力。1. 特征提取:输入特征图经过卷积层提取特征。
2025-03-07 14:52:36
105
原创 计算机网络基础:VLAN(虚拟局域网)
虚拟局域网:可以用来隔离广播广播和广播域:arp 出不了路由器,只能攻击内网路由器可以隔离广播(物理隔离)缺点是成本高、不灵活。
2025-03-06 10:53:25
427
原创 计算机网络基础:DNS 部署与安全
目录1. DNS2. 域名的组成3. DNS 服务器4. DNS 解析种类5. 安装DNS服务器6. 配置dns服务器7. 客户机指向dns服务器8. 反向解析过程9. 虚拟机上网介绍10. 别名11. 转发器如下:顶级域的表示:例子:端口号:TCP 53、DNS 53处理域名的顺序:先找缓存、看看是不是负责这种域名的解析、找转化器、找根客户机心理路程:1. 先看自己缓存2. 看 host 文件3. 寻求dns服务器帮助按照查询方式: 递归查询:所问所答
2025-03-05 09:11:07
978
原创 计算机网络基础:DHCP服务的部署
DHCP:动态分配IP地址(端口号是UDP 67/68)地址池、作用域:IP、子网掩码、网关、DNS、租期优点: DHCP租约过程,分为4个过程:dhcp 服务器的续约:可以部署dhcp的设备:windows、linux、三成交换机、路由器服务器的ip一定是静态的服务的位置:有的版本的服务器没有,需要用别的方式载入,下载个2003的镜像就行位置在这:安装后可以发现多了一个:对于服务器来说,安装了服务就会默认打开 右键新建作用域即可【当服务启动的时候,端口就在,停止服务的话,端口就会关闭】配置作用域:可以排除
2025-03-05 08:00:00
254
原创 计算机网络基础:文件共享服务器(注册表更改)
通过网络将文件共享给别人,提供文件的上传和下载【CIFS协议FTP协议是全球通用的,cifs是微软开发的服务:server,端口号445。
2025-03-04 13:06:47
182
原创 计算机网络基础:NTFS 安全权限
文件系统是在外部储存设备上组织文件的方法,其实就是存储格式格式化相当于在磁盘分区上制作文件系统、打格子的过程,放的文件越大,这里可以设置的大一点查看是否是NTFS的储存格式。
2025-03-04 08:30:00
200
原创 DenseUNet 改进:添加ASPP模块
解决方案:ASPP通过并行空洞卷积(Dilated Convolution),以不同扩张率(Dilation Rate)提取多尺度特征,融合后增强模型感知能力。示例:扩张率18的3×3卷积,实际感受野为 **(18×2+1)×(18×2+1)=37×37**。多尺度特征融合:通过不同扩张率,同时捕捉局部细节(小扩张率)和全局上下文(大扩张率)。4个并行卷积层,扩张率分别为 1, 6, 12, 18(对应不同感受野)。扩大感受野:空洞卷积在不增加参数量或下采样的前提下,扩大卷积核感受野。
2025-03-03 19:56:24
375
原创 UNet 改进:添加ASPP模块捕捉多尺度上下文信息
(,空洞空间金字塔池化)是语义分割模型(如DeepLab系列)中的核心模块,旨在,提升模型对不同尺寸物体的分割效果。:图像中的物体尺寸差异大(如汽车 vs. 行人),传统卷积层难以同时捕捉多尺度特征。:ASPP通过,以不同扩张率(Dilation Rate)提取多尺度特征,融合后增强模型感知能力。ASPP模块由以下部分组成(以DeepLabv3为例):4个并行卷积层,扩张率分别为 (对应不同感受野)。每个分支含:空洞卷积 → 批量归一化(BN) → ReLU激活。
2025-03-03 16:33:51
428
原创 计算机网络基础:利用5次shift键漏洞破解用户密码
如下:有这个窗口就行重新启动,当出现这个界面,拔电源出现这个界面即可:没有的话,一直拔电源,开机就行修复取消:会出现这个界面:根据上面的目录,替换原有的5次shift的命令然后将cmd替换为5次shift键的程序,下面的名字(提前备份)重启即可:点击5次shift键更换密码:回车即可进入: 创新新用户:
2025-03-03 09:58:57
181
原创 计算机网络基础:服务器远程连接管理(Telnet命令)
输入对方的账户密码:新建用户的话,需要加入远程权限的组里。图形化远程连接:需要右键我的电脑,打开远允许程桌面连接。登录即可:需要把登录的用户加入下面的组里。3. 拥有远程管理权限(组)的用户。telnet的端口号:23。2. 服务器开了远程服务。1. 能ping 通。
2025-03-03 08:45:16
757
基于resnet网络和其改进对眼底疾病的分类任务,两只眼睛同时输入(6通道输入)
2025-04-05
医学图像分割数据集:小型胰腺图像语义分割数据集(约150张数据和标签)
2025-04-05
深度学习基于SGESL模块的ResNet改进:增强语义特征提取与分类性能优化系统设计
2025-04-05
医学图像分割数据集:眼底血管图像语义分割数据集(约48张数据和标签)
2025-04-04
深度学习基于SimAM注意力机制的ResNet50模型改进:卷积神经网络图像分类性能提升
2025-04-03
医学图像分割数据:基于超声左耳图像切片分割【包含3个切面的切片数据、标签文件、可视化代码】
2025-04-03
医学图像分割数据:大型CT脊椎切片分割(spinie)【包含3个切面的切片数据、标签文件、可视化代码】
2025-04-03
基于resnet、swin-transformer、mobilenetv4实现的图像分类项目
2025-04-02
基于 MobileUnet现的医学图像语义分割项目:人体腹部脊椎块分割【含热力图可视化、完整结果】
2025-04-02
【深度学习、图像识别】基于PPA模块的UNet图像分割模型设计:多尺度特征融合与注意力机制应用
2025-04-02
MobileNet V3 模型实现的迁移学习、计算机视觉识别实战:Flyai新冠分类【可一键运行】
2025-04-01
基于resnet、vision-transformer、yolo11实现的对X射线下的种植牙齿检测
2025-04-01
基于Denseunet在医学细胞的多分割完整项目
2025-03-30
基于ResUNet和Unet在BS乳腺癌症数据集上的分割系统,包含项目说明
2025-03-30
医学图像分类数据集: x射线下的种植牙齿图像分类【包括划分好的数据、类别字典文件、python数据可视化脚本】
2025-03-30
目标检测数据集:(基于X射线下的种植牙齿型号分类)目标图像检测数据【VOC标注格式、包含数据和标签】
2025-03-30
基于卷积神经网络的猫狗分类轻量化模型,参数8比特定点,模型不足100kb
2025-03-26
基于 Resnet 融合CBAM改进实战项目: 结肠癌组织病理学图像分类
2025-03-26
医学图像分类数据集: 结肠癌组织病理学图像分类【包括划分好的数据、类别字典文件、python数据可视化脚本】
2025-03-26
医学图像分类数据集: 肺癌组织病理学图像分类【包括划分好的数据、类别字典文件、python数据可视化脚本】
2025-03-26
基于对细胞中线粒体(ch2)、细胞核(ch3)、内质网(ch4)、溶酶体(ch5)数据集中的不良数据的筛选项目
2025-03-25
基于Swin-Transformer系列下的神经网络模型实现的迁移学习项目实战: 棉花植株病害分类
2025-03-25
基于整张苹果叶片病害分割数据集【包含数据集、标签文件、可视化代码】
2025-03-24
基于transformer和SwinUNet卷积神经网络对MoNuSAC细胞的图像分割
2025-03-24
计算机视觉项目:Shufflenet V2 模型实现的图像识别项目:小麦植物病害识别
2025-03-24
图像分类数据集: 小麦植物病害图像分类【包括划分好的数据、类别字典文件、python数据可视化脚本】
2025-03-24
目标检测数据集:(x射线胸部结核病)目标图像检测数据【VOC标注格式、包含数据和标签】
2025-03-24
计算机视觉项目:VGG神经网络(vgg11、vgg13、vgg16等)实现的迁移学习、图像识别:x射线胸部疾病
2025-03-24
医学图像分类数据集: 基于X 射线大规模结核病图像分类【包括划分好的数据、类别字典文件、python数据可视化脚本】
2025-03-24
医学图像分割数据集:4种显微镜下的细胞目标图像语义分割数据集(约1000张数据和标签)
2025-03-23
基于双侧骶髂关节强直性脊柱炎的swinUNet、resunet、unet分割实验对比
2025-03-23
基于DenseNet121,161,169,201等模型实现的迁移学习识别项目实战:8种眼底疾病识别
2025-03-23
基于transformer和unet卷积神经网络对心脏左心室分割的研究、已经训练完成
2025-03-21
基于pytorch实现的ghostnetv1、v2、v3对11种生活风景场景、建筑识别【完整代码+数据集】
2025-03-20
基于甲状腺结节良恶性识别的实验探究【包含多个分类模型和改进】
2025-03-20
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人