自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Henry的博客

佛系学习,正常摆烂

  • 博客(498)
  • 收藏
  • 关注

原创 Unet 实战分割项目、多尺度训练、多类别分割

之前写了篇二值图像分割的项目,支持多尺度训练,网络采用backbone为vgg的unet网络。本章实现的unet网络的多类别分割,也就是分割可以是两个类别,也可以是多个类别。训练过程仍然采用多尺度训练,即网络会随机将图片缩放到设定尺寸的0.5-1.5倍之间。

2024-02-05 21:38:35 7754 20

原创 ShuffleNet 改进:与通道注意力机制(CAM)的结合实现

本文提出了一种改进的ShuffleNetV2模型,通过集成通道注意力机制(CAM)增强特征表示能力。CAM模块采用双分支结构(平均池化+最大池化)学习通道权重,并使用带压缩比的MLP减少参数量。模型保留了ShuffleNetV2的轻量特性,支持预训练权重加载,通过维度转换技巧将CAM无缝集成到网络中。实验验证表明,该方法在保持高效性的同时提升了模型性能,为轻量级网络设计提供了有效参考。代码开源,可直接应用于图像分类等任务。

2025-06-09 16:20:40 52

原创 改进系列(13):基于改进U-ResNet的脊椎医学图像分割系统设计与实现

本文提出一种改进的U-ResNet医学图像分割系统,通过融合残差连接、通道注意力机制和空间金字塔池化模块,显著提升分割精度。系统采用端到端深度学习框架,实现数据预处理、模型训练到可视化分析全流程自动化。实验表明,该方法平均DSC达0.92以上,优于传统分割网络,并提供友好GUI界面支持交互式操作。改进的网络架构包含多级残差块编码器、多尺度瓶颈层和带注意力机制的解码器,配合联合损失函数优化,有效解决医学图像分割中的特征提取不足和小目标分割难题。系统还实现了六种评估指标计算和多种可视化分析功能。

2025-06-09 13:42:51 759

原创 MobileNet 改进:基于MobileNetV2和SSPP的图像分类

本文介绍了一种结合MobileNetV2和空间金字塔池化(SSPP)的轻量级图像分类模型。该模型采用MobileNetV2作为特征提取器,并集成了自定义SSPP模块,通过多尺度池化增强特征表达能力。模型结构包含特征提取、SSPP处理和线性分类三个部分,其中SSPP支持可配置的池化层级(默认1×1,2×2,4×4)。这种设计既保持了MobileNetV2的高效特性,又提升了模型对不同尺寸特征的适应能力。测试代码验证了模型可处理224×224输入并输出正确维度的分类结果。该实现为计算机视觉任务提供了一种平衡性能

2025-06-06 09:10:32 58

原创 ResUNet 改进:融合DLKA注意力机制

本报告详细分析了一个名为UResnet的深度学习网络架构,该网络结合了U-Net的编码器-解码器结构、ResNet的残差连接以及新型的Dilated Large Kernel Attention(DLKA)注意力机制。该网络设计用于图像分割任务,通过多尺度特征提取和融合实现精确的像素级预测。

2025-06-05 14:29:39 37

原创 CentOS在vmware局域网内搭建DHCP服务器【踩坑记录】

本文记录了在CentOS系统上配置DHCP服务的完整流程:首先确保NAT模式联网,修改yum镜像源后安装DHCP服务;然后配置虚拟机网络为vmnet10(虚拟交换机模式),设置CentOS静态IP时需特别注意格式规范;接着编辑dhcpd.conf文件定义IP地址池(192.168.10.200-210)、网关和DNS;最后启动DHCP服务并设置防火墙规则。成功搭建后,Windows客户端切换为自动获取IP即可完成网络配置,通过/var/lib/dhcpd/dhcpd.leases文件可查看租约信息。全程重点

2025-06-04 18:19:32 918 1

原创 基于深度学习(Unet和SwinUnet)的医学图像分割系统设计与实现:超声心脏分割

本文提出了一种基于深度学习的医学图像分割系统,采用U-Net和Swin-Unet两种网络架构,实现了高效的医学图像分割。系统包含完整的数据预处理、模型训练评估流程,并提供用户友好的图形界面。实验结果表明,该系统在CT等医学图像分割任务中表现优异,Swin-Unet架构性能优于传统U-Net,窗宽窗位调整显著改善CT图像分割效果。系统具有模块化设计、易扩展等特点,为临床诊断提供了有效的计算机辅助工具。

2025-06-04 09:56:29 281

原创 基于人工智能算法实现的AI五子棋博弈

本项目开发了一个基于Python和Pygame的五子棋游戏系统,包含三种对战模式:人人对战、人机对战和AI对战。系统采用模块化设计,包括棋盘管理、AI决策和主程序三大模块。AI算法基于博弈树搜索和评估函数,实现了棋型识别、Alpha-Beta剪枝、迭代加深搜索等优化技术,能够提供较强对战能力。系统支持自定义游戏模式和AI参数,具有清晰的用户界面和交互设计。未来可进一步优化算法性能并扩展功能,如增加难度选择、网络对战等。项目代码结构合理,便于后续开发和改进。

2025-06-03 15:26:16 1029

原创 NLP实战(5):基于LSTM的电影评论情感分析模型研究

本研究提出了一种基于双向LSTM的深度学习模型,用于电影评论的细粒度情感分类(5分类)。模型采用词嵌入层(100维)、双向LSTM层(2层256维)和全连接层结构,在标准数据集上通过5折交叉验证评估,平均准确率达到55.52%。实验结果显示模型能够有效区分负面、中性到正面的情感表达,其中中性情感与"有点积极/负面"的区分存在改进空间。研究提供了完整的数据预处理流程、模型架构和训练策略,代码已实现模块化,便于复现。未来可结合预训练词向量和注意力机制进一步提升性能。

2025-06-03 13:27:38 1161

原创 U-ResNet 改进:集成CoordinateAttention(坐标注意力)

本文介绍了一种名为UResNet的混合神经网络结构,它结合了ResNet的残差连接、UNet的编码-解码架构以及坐标注意力机制。该网络通过BasicBlock/BottleNeck构建块实现特征提取,采用VGGBlock进行卷积处理,并引入CoordinateAttention模块增强位置感知。在编码阶段逐层下采样,解码阶段通过上采样和跳跃连接恢复分辨率,最终输出分割结果。代码实现展示了完整的网络架构和数据处理流程,测试结果表明该模型能有效处理224×224的输入图像。这种创新组合利用了不同网络的优点,为图

2025-06-02 11:12:45 47

原创 U-ResNet 改进:集成特征金字塔网络(FPN)

本文介绍了UResNet模型的设计与实现,该模型融合了U-Net的编码器-解码器结构、ResNet的残差连接以及特征金字塔网络(FPN)的多尺度特征提取能力。模型包含Up模块、BasicBlock、BottleNeck、VGGBlock和FPN等核心组件,通过编码器下采样、解码器上采样与特征融合,最终输出分割结果。测试表明模型能正确处理256×256输入并输出对应尺寸的分割图。UResNet兼具U-Net的信息保留能力、ResNet的梯度缓解特性以及FPN的多尺度优势,为图像分割任务提供了灵活高效的解决方案

2025-06-02 10:18:00 314

原创 DeepSeek:不同模式(v3、R1)如何选择?

三种模型对比:基础版为默认选项;V3在开放性和规范性文本生成任务中表现优于R1,但使用R1时不宜提供示例(其自主性强)。官方提供PromptLibrary提示语库,V3和R1各有专用提示语模板,例如可将DeepSeek转化为智能体的定制提示方案(150字)

2025-05-29 15:29:02 354

原创 改进系列(12):基于SAM交互式点提示的UNet腹部多脏器分割方法研究

本文提出了一种基于点提示机制的交互式UNet网络用于腹部多脏器医学图像分割。该方法在传统UNet基础上扩展输入通道,加入点提示信息,允许用户在推理阶段通过点击前景和背景区域提供交互指导。实验采用394例腹部CT图像训练,98例验证,最终在验证集上达到Dice系数0.9358和IoU 0.8805的优异性能。与全自动方法相比,该交互式分割方案更具灵活性,能有效修正边界模糊区域的分割错误,为临床医学图像分析提供了实用解决方案。

2025-05-27 10:02:06 712

原创 传输层:TCP协议详解

TCP协议摘要:TCP是一种面向字节流的可靠传输协议,其报文首部包含端口号、序号、确认号等关键字段。通过标记位(URG/ACK/SYN等)控制连接状态,利用窗口机制和校验和确保数据传输可靠性。支持紧急指针处理优先数据,采用自动重传(ARQ)和滑动窗口协议实现高效传输。接收窗口大小动态调整流量,选择确认选项优化重传机制。

2025-05-26 15:05:49 318

原创 ViT模型改进:基于双路径的多尺度特征融合

本文介绍了一种结合Vision Transformer (ViT) 和 ConvNeXt 的双路径深度学习模型,该模型通过多尺度处理和特征融合机制,在图像分类任务中表现出色。模型的核心组件包括多尺度模块和特征融合模块,分别用于捕获不同尺度的空间信息和自适应融合两种架构的特征。多尺度模块利用不同空洞率的卷积并行处理输入特征,而特征融合模块则通过注意力机制动态调整ViT和ConvNeXt特征的权重。双路径模型的设计充分发挥了ViT在全局特征捕获和ConvNeXt在局部特征提取上的优势,并通过预训练权重加速收敛。

2025-05-23 08:26:57 79

原创 插值算法 - 图像缩放插值QT

本文介绍了一个基于PyQt5和OpenCV的图像缩放插值演示工具的实现。该工具允许用户上传本地图片(PNG/JPG/JPEG格式),选择四种常见的插值方法(最近邻插值、双线性插值、双三次插值、区域像素关系插值),并通过滑块实时调整缩放比例(0.1倍到4.0倍),同时并排显示原始图像和缩放后的图像。工具的核心功能包括图像加载与显示、插值方法处理和缩放应用。代码结构清晰,主类ImageScalingGUI负责构建GUI界面和处理用户交互,核心函数apply_scaling根据用户选择的插值方法应用不同的Open

2025-05-22 18:04:18 290

原创 改进系列(11):基于TransUNet改进SA和特征金字塔注意力模块:心脏超声分割

TransUNet是一种结合了Transformer和U-Net架构的医学图像分割模型,它通过将Transformer的强大全局建模能力与U-Net的局部特征提取能力相结合,在医学图像分割任务中表现出色。

2025-05-14 15:43:37 998

原创 DenseUnet 改进:结合RepHMS动态调整尺度模块

DenseUNet是一种创新的图像分割网络架构,结合了DenseNet的特征提取能力和U-Net的多尺度特征融合机制。其核心创新在于引入了RepHMS模块,该模块支持动态多尺度特征调整,能够根据目标尺寸灵活处理特征图。DenseUNet基于DenseNet-161构建,包含编码路径和解码路径,通过RepHMS模块在解码路径的每个阶段进行多尺度特征调整,并与编码路径的特征进行融合。网络还采用了密集跳跃连接,确保特征的有效传递和重用。DenseUNet支持任意输入通道数和可配置的输出类别数,适用于需要精确像素级

2025-05-14 07:30:00 59

原创 传输层:UDP协议

UDP(User Datagram Protocol,用户数据报协议)是一种无连接的传输层协议,适用于对实时性要求高但允许少量丢包的应用,如视频流和DNS查询。UDP报文由8字节的头部和可变长度的数据部分组成。头部包括源端口号、目的端口号、报文长度和校验和。校验和用于检测传输错误,计算时包括伪头部、UDP头部和数据部分。UDP的特点是无连接、不可靠和轻量级,适用于低延迟场景。示例报文展示了如何构造一个简单的UDP报文。

2025-05-13 19:40:35 427

原创 网络层:ARP协议(原理、攻击和防御)

声明:本文只做原理讲解,分享技术。一切实验均在虚拟机中实现

2025-05-13 10:33:03 229

原创 FCN改进:CBAM注意力机制增强FCN-ResNet50分割模型

本文介绍了一个结合CBAM(Convolutional Block Attention Module)注意力机制的FCN-ResNet50语义分割模型的实现。CBAM模块通过通道注意力和空间注意力机制,帮助模型聚焦于图像中的重要特征和区域,从而提高分割精度。代码首先实现了CBAM模块,接着在FCN-ResNet50模型的ResNet50骨干网络的四个层级后分别添加了CBAM模块,最后进行了前向传播测试。测试结果显示,模型能够输出5个类别的分割概率图。这种设计通过在不同层级添加注意力模块,捕捉不同尺度的特征,

2025-05-13 09:24:40 582

原创 网络层:ICMP协议

ICMP(Internet Control Message Protocol)是IP协议的一部分,用于发送差错报告和网络诊断信息。其报文格式包括类型和代码字段,用于标识不同的差错类型。常见的差错报告报文包括TTL过期、目标主机不可达和路由重定向。TTL过期表示数据包在传输过程中超过了生存时间;目标主机不可达表示无法找到目标网络的路由;路由重定向则指示更优的路由路径。此外,ping命令用于测试网络连通性,tracert命令用于追踪数据包路径,pathping命令结合了ping和tracert的功能,提供更详细

2025-05-12 18:14:53 214

原创 DeepSeek+Kimi实战:PPT制作教程

如下:生成完了,进行复制:如下:Kimi - 会推理解析,能深度思考的AI助手选择这里进行将deepseek生成的复制进去生成ppt可以选择模板,点生成即可如下:可以自行编辑或者直接下载下载即可:会自动在网页弹窗参考制作的ppt:【免费】人工智能授课ppt参考资源-优快云文库

2025-05-08 17:49:25 326

原创 DeepSeek+即梦AI实战:图片制作教程

复制这里: 如下:即梦AI - 一站式AI创作平台点进这里复制即可:如下: 效果不能说差吧,相比之前自己的提示词,确实好了不少

2025-05-08 15:29:32 233

原创 第20章:深度学习图像分割实战之UNet与DeepLabV3的对比分析【脊椎分割实验】

本文实现了一个完整的图像分割项目框架,通过对比UNet和DeepLabV3两种经典网络,展示了不同架构在分割任务上的表现差异。项目提供了从数据预处理到结果可视化的完整流程,可以作为图像分割任务的开发模板。实验结果表明,没有绝对优越的模型,实际应用中需要根据具体任务需求和数据特点选择合适的架构。本文通过对比两种经典分割网络——UNet和DeepLabV3,分享一个完整的图像分割项目实现,包括数据预处理、模型训练、评估指标可视化和模型对比分析。可以自己将模型扩充多个,然后,这里填对应的json结果即可。

2025-05-07 10:20:14 1301

原创 opencv实战:银行卡卡号识别

在当今数字化时代,光学字符识别(OCR)技术变得越来越重要。本文将详细介绍如何使用来识别银行卡的卡号,并在原图上标注识别结果。

2025-05-06 18:46:33 875

原创 【C语言】推箱子小游戏

这是一个基于C语言实现的经典推箱子游戏,采用控制台字符界面进行交互。玩家通过WASD键控制角色推动箱子,目标是将所有箱子移动到指定点位。程序包含地图绘制、碰撞检测、胜利判断等完整游戏机制。

2025-05-06 16:14:31 210

原创 EfficientNet 改进:与Transformer结合的图像分类模型

这个实现将EfficientNet的高效特征提取能力与Transformer的强大序列建模能力相结合,主要包含以下几个核心组件:​​基础卷积模块​​:包括Swish激活函数和ConvBnAct组合模块​​MBConv模块​​:EfficientNet的核心构建块​​Squeeze-Excitation注意力机制​​:通道注意力模块​​Transformer分类头​​:替代传统全连接层的创新设计。

2025-05-04 12:38:12 98

原创 SwinTransformer 改进:与PSConv结合的创新设计

这段代码实现了一个改进版的Swin Transformer模型,主要创新点在于:使用Swin Transformer作为基础架构在patch embedding层后加入PSConv模块自定义分类头以适应不同任务本文分析的代码展示了一种创新的深度学习架构设计思路,通过将Swin Transformer与PSConv相结合,在保持Transformer全局建模能力的同时,增强了局部特征提取能力。

2025-05-04 12:22:59 97

原创 DenseUNet 改进:结合APBottleneck(注意力瓶颈模块)

今天我们将深入分析一个名为DenseUNet的神经网络架构,它巧妙地将DenseNet的强大特征提取能力与UNet的经典U型结构相结合,并加入了注意力机制来提升模型性能。这个网络特别适用于图像分割任务,能够处理不同数量的输入和输出通道。

2025-04-30 10:55:28 694

原创 改进系列(10):基于SwinTransformer+CBAM+多尺度特征融合+FocalLoss改进:自动驾驶地面路况识别

整体特点:​​技术先进性​​:结合了Swin Transformer和注意力机制,利用了当前先进的深度学习技术。​​完整流程​​:覆盖了从数据准备、模型训练到应用部署的完整流程。​​模块化设计​​:各组件职责明确,耦合度低,便于维护和扩展。​​可视化丰富​​:提供多种训练过程和数据分布的可视化,便于模型分析和调试。​​用户友好​​:通过GUI界面降低了使用门槛,使技术成果更易于实际应用。​​文档完整​​:代码结构清晰,注释充分,便于理解和二次开发。

2025-04-30 10:34:24 1443

原创 插值算法 - 双三次插值(Bicubic Interpolation)

双三次插值(Bicubic Interpolation)是一种高质量的图像插值方法,比双线性插值更平滑,能保留更多细节。它广泛应用于图像缩放、旋转、变形等任务。​双三次插值基于​​,在二维图像中,它使用目标像素周围的 ​​ 进行加权计算。​​在一维情况下,给定 4 个点 p−1​,p0​,p1​,p2​,目标点 x∈[0,1] 的插值公式为:其中,系数 a,b,c,d 由边界条件(如连续性和平滑性)决定。更常用的形式是​​(一种三次插值方法):​​在二维图像中,双三次插值分别在 ​。

2025-04-29 17:47:25 359

原创 使用 PyTorch 实现遗传算法分类MNIST手写数据【附代码】

优化算法能处理复杂问题,遗传算法是其中一种。它可以方便地与PyTorch结合,用于多种优化任务。接下来介绍如何用PyTorch实现遗传算法。

2025-04-29 08:42:56 1143

原创 PYTHON 自动化办公:学生点名系统开发详解

本文实现的学生点名系统是一个基于Python Tkinter库开发的图形界面应用程序主要用于在课堂上、办公中随机选择某人。从文本文件加载学生名单以方阵形式展示所有学生随机滚动高亮学生姓名可自定义的系统设置动画效果的点名过程这个学生点名系统展示了如何使用Python Tkinter创建实用的GUI应用程序。它结合了文件操作、界面设计、动画效果和配置管理等多项技术,是一个很好的Tkinter学习案例。系统结构清晰,功能完整,适合作为课堂演示工具或进一步开发的起点。

2025-04-28 09:31:03 943

原创 对DeepSeek大模型的深度观察与思考

经过一段时间的深入测试和使用,我对DeepSeek大模型有了更全面的认识。这个人工智能系统展现出的能力令人印象深刻,同时也引发了对AI发展现状和未来方向诸多思考。

2025-04-28 08:34:03 1016

原创 html5:从零构建经典游戏-扫雷游戏

这个扫雷游戏实现包含以下核心功能:10×10的游戏棋盘15个随机分布的地雷左键点击揭开格子右键点击标记地雷自动展开空白区域胜利/失败判定这个扫雷游戏实现展示了如何使用基本的Web技术创建经典游戏。通过合理的数据结构和算法设计,实现了游戏的核心逻辑。代码结构清晰,适合初学者学习和扩展。

2025-04-27 19:56:09 1424

原创 DeepSeek 开发、提示词实操手册

说明 1:从零开始,10 天精通DeepSeek,是个理想,挺难实现的。说明 2:文末,有“优质提示词库(40 个场景模板)”,是 deepseek 提供的。实际上,使用deepseek 时,可以脑洞更大一些。比如,“请思想性、知识性、文学性兼具,方便我向 00 后讲解这事”,直接谈场景,谈对象,谈目的,谈困难,甚至可以很抽象。说明 3:为方便用户过上更美好生活,DeepSeek 贴心地提供了一些“变现指南”。请务必留意,仅仅是“指南”。一旦涉及经济往来, 务必留意合同、版权、合规性等问题。

2025-04-25 09:30:57 934

原创 NLP实战(4):使用PyTorch构建LSTM模型预测糖尿病

在这篇博客中,我们详细介绍了如何使用PyTorch构建和训练一个双层LSTM模型来预测糖尿病。关键点包括:数据准备和加载LSTM模型架构设计训练过程和验证模型评估和可视化虽然LSTM通常用于时间序列数据,但在这个例子中我们将其应用于非时间序列数据,展示了PyTorch的灵活性。通过调整模型架构、超参数和数据预处理,可以进一步提高模型性能。希望这篇博客能帮助你理解如何使用PyTorch实现LSTM模型!

2025-04-24 13:54:41 1375

原创 SwinTransformer 改进:结合局部拟合与全局注意力DTAB模块

DTAB模块是一种新型的神经网络构建块,它结合了两种强大的特征学习机制:​​局部拟合组件​​:通过多层感知机(MLP)捕捉输入数据的局部特征​​全局视角组件​​:利用多头自注意力机制理解特征间的全局关系这种双轨设计使得DTAB能够同时捕捉细粒度的局部特征和宏观的全局关系,为下游任务提供更丰富的特征表示。

2025-04-23 09:30:00 145

原创 改进系列(9):基于VisionTransformer+InceptionDW+Focal_loss改进实现的遥感地面目标识别

例如,一个3×3标准卷积的计算复杂度是输入通道数×输出通道数×3×3,而深度可分离卷积将其分解为输入通道数×3×3(DWConv)和输入通道数×输出通道数×1×1(PWConv),计算量大幅降低。具体而言,InceptionDW模块通常包含多个分支,例如1×1卷积、3×3深度可分离卷积、5×5深度可分离卷积,以及全局平均池化等操作,这些分支的输出在通道维度拼接后融合,形成丰富的多尺度特征表示。--data--test--- 测试集的图像(如果有的话)--data--val--- 验证集的图像。

2025-04-23 08:20:48 1007

基于Unet改进系列:加入attenUnet模块对室外场景图像语义分割的项目

基于Unet改进系列:加入attenUnet模块对【室外场景】图像语义分割的项目,项目没有训练,可以自行训练 数据集采用ADE场景图像分割,数据在data目录下,划分了训练集和验证集。 网络介绍:代码分为两个网络,unet和attention_Unet,如果想要做对比实验,直接更改train脚本的参数即可,默认的epoch是100,学习率采用cos余弦退火算法,初始值0.01,衰减到0.00001。如果想在大尺度进行训练,修改img-size参数即可,优化器采用了AdamW。评估的指标为dice、iou、recall、precision、f1、pixel accuracy等等,代码会对训练和验证集进行评估,结果保存runs下的json文件中。 网络推理的时候,会自动将inference/img下所有图像进行推理,并且保存在infer_get、show下,前者是推理gt阈值图像,后者是img+推理gt的掩膜效果

2025-06-03

基于网页版推理实现的ResUNet和UNet图像分割项目:室外场景多类别分割

数据集采用【室外场景多类别分割】,数据在data目录下,划分了训练集和验证集。【代码可一键运行】 【介绍】分割网络为ResUNet和UNet(可以自行选择),学习率采用cos余弦退火算法。如果想在大尺度进行训练,修改base-size参数即可,优化器采用了AdamW。评估的指标为dice、iou、recall、precision、f1、pixel accuracy等等,代码会对训练和验证集进行评估,结果保存runs下的json文件中。 网络推理的时候采用可视化推理,运行infer脚本会打开本地网页,上传图片即可进行推理 更多医学图像语义分割实战:https://blog.youkuaiyun.com/qq_44886601/category_12816068.html 图像分类、语义分割网络改进:https://blog.youkuaiyun.com/qq_44886601/category_12858320.html

2025-06-03

基于ConVNeXt 神经网络模型实现的迁移学习、图像识别项目:工业金属表面缺陷检测

该项目是一个基于ConVNeXt模型的图像分类系统,旨在通过深度学习技术实现高效的图像分类任务。系统主要由三个模块组成:模型训练、推理预测和工具函数。首先,train.py脚本负责模型的训练过程,用户可以通过命令行参数设置模型类型、优化器、学习率、批量大小等超参数。训练过程中,脚本会自动进行数据预处理、模型初始化、训练与验证循环,并保存最佳模型权重和训练日志。训练结束后,系统会生成损失曲线、准确率曲线、混淆矩阵、recall、F1、precision、ROC曲线和AUC值等可化结果,帮助用户评估模型性能。其次,infer.py脚本用于推理预测,可以通过Streamlit提供的Web界面上传图像,系统会调用训练好的模型进行图像分类,并返回预测结果及其置信度 关于AI改进参考:https://blog.youkuaiyun.com/qq_44886601/category_12858320.html

2025-06-03

基于Swin-Transformer改进CBAM模块+多尺度特征融合+Focal loss分类项目:工业金属表面缺陷识别【附带推理QT系统】

【项目简介】 代码主干网络采用Swin-Transformer +CBAM+多尺度特征融合改进网络。pretrained参数为是否采用官方预训练模型。为了做对比消融试验,优化器采用了Adam和SGD、AdamW三种。损失函数采用Focal loss、学习率优化策略采用cos余弦退火算法 【评估网络】 评估的指标采用loss和准确率(accuracy),分别会在训练集和验证集上进行评估、输出、绘制曲线图像。同时会在训练集、验证集进行一系列评估,包含混淆矩阵、recall、precision、F1 score等等曲线图像,以及recall、precision、F1 score、特异度的输出信息等等。同时生成验证集的ROC、PR曲线,样本数量柱状图等。如果有测试集的话,会自动进行测试 【QT推理】直接运行qt脚本即可 分类改进专栏:https://blog.youkuaiyun.com/qq_44886601/category_12803200.html

2025-06-03

目标检测数据集:(高分辨率下的花丛中昆虫)目标图像检测数据【VOC标注格式、包含数据和标签】

数据保存按照文件夹保存,经测试,可直接用作目标检测数据集,无需额外处理。 【数据集详情】共400张左右数据和对应的xml标注文件,类别请查看classes文件: { "0": "Insect" } 关于yolo实战检测教程:https://blog.youkuaiyun.com/qq_44886601/article/details/134878776 yolov5的改进实战:https://blog.youkuaiyun.com/qq_44886601/category_12605353.html

2025-06-03

花卉丛中的昆虫图像目标检测数据【已标注,约2500张数据和标签,YOLO 标注格式】

花卉丛中的昆虫图像目标检测数据【已标注,约2500张数据和标签,YOLO 标注格式】 类别个数【9】:Coccinellidae septempunctata、Apis mellifera、Bombus lapidarius、Bombus terrestris等【具体参考classes文件】 数据集做了训练集、验证集划分。 yolov5的改进实战:https://blog.youkuaiyun.com/qq_44886601/category_12605353.html 【更多图像分类、图像分割(医学)、目标检测(yolo)的项目以及相应网络的改进,可以参考本人主页:https://blog.youkuaiyun.com/qq_44886601/category_12803200.html】

2025-06-03

基于 vision-Transformer +InceptionDW 模块+Focal loss改进的【农作物17种害虫检测】

【项目简介】 代码主干网络采用 vision-Transformer +InceptionDW改进网络。pretrained和freeze_layers参数为是否采用官方预训练模型和是否仅训练分类头。为了做对比消融试验,优化器采用了Adam和SGD、AdamW三种。损失函数采用Focal loss、学习率优化策略采用cos余弦退火算法 【评估网络】 评估的指标采用loss和准确率(accuracy),分别会在训练集和验证集上进行评估、输出、绘制曲线图像。同时会在训练集、验证集进行一系列评估,包含混淆矩阵、recall、precision、F1 score等等曲线图像,以及recall、precision、F1 score、特异度的输出信息等等。同时生成验证集的ROC、PR曲线,样本数量柱状图等 【可视化网页推理】参考readme运行即可在本地网页进行上传图片推理 【本项目为(农作物17种害虫检测)】 分类改进专栏:https://blog.youkuaiyun.com/qq_44886601/category_12803200.html

2025-06-02

面向医学图像的交互式分割工具:PyTorch实现Unet和swinUnet分割项目:超声心脏分割

本项目集合实现了一个基于PyTorch的图像分割系统,包含数据加载、模型训练、评估和可视化功能,支持CT图像对比度增强及多类别分割任务。 【数据加载与预处理】 系统通过MyDataset类实现数据加载,支持自定义图像/掩膜路径、文件格式及基础尺寸调整。数据增强包括随机水平/垂直翻转,并提供CT图像的窗口化对比度增强选项。标签图像被二值化处理,多类别分割任务可通过grayList.txt文件定义类别灰度值。测试阶段可可视化原始图像与分割结果,支持保存预测图。 【模型训练与评估 】 训练流程包含数据集划分、数据加载器配置及学习率调度。采用交叉熵损失函数和AdamW优化器,结合余弦退火策略动态调整学习率。训练过程中实时计算并记录损失、IoU、Dice系数等指标,通过混淆矩阵评估模型性能。每轮训练后自动保存最优权重,并生成训练日志与可视化曲线(损失、IoU、精度等)。模型架构支持UNet和SwinUnet两种选择,参数量和FLOPs通过thop库计算。 【系统集成与交互界面 】 通过PyQt5构建图形界面,用户可选择图片并查看分割结果。界面集成颜色映射功能,将预测类别转换为RGB颜色显示。系统支持批量处理与结果保存,但当前版本未完全集成训练模块,需通过命令行参数配置训练参数(如--model、--epochs等)。训练脚本自动创建目录结构,保存模型权重、日志及可视化结果。 【辅助功能】 包含文件管理工具(如清理旧训练结果)、图像预处理验证(plot函数)及混淆矩阵分析。支持多线程数据加载以提升效率,并通过tqdm显示进度条。系统适配CPU/GPU环境,自动检测可用设备。测试阶段可绘制学习率衰减曲线及综合性能指标图,便于分析模型收敛情况。 该系统适用于医学图像分割任务,具备模块化设计,便于扩展新模型或数据增强策略。

2025-05-29

融合SAM提示学习的UNet医学图像分割方法与应用

医学图像分割系统介绍 本项目是一个基于改进UNet架构的医学图像分割系统,专门设计用于处理医学影像中的精确分割任务。系统通过结合深度学习技术和交互式提示功能,实现了高效准确的图像分割。 核心架构 系统采用UNet作为基础模型,并进行了以下改进: 输入通道扩展为4通道(3通道RGB+1通道提示框) 使用双卷积块(DoubleConv)增强特征提取能力 加入跳跃连接(skip connections)实现多尺度特征融合 输出层采用sigmoid激活函数实现二值分割 关键技术特点 交互式分割:系统支持两种交互方式: 通过边界框提示(bbox prompt)引导分割 支持用户点击正负样本点进行精细调整 数据增强:实现了多种数据增强策略,包括随机水平/垂直翻转和边界框位置扰动,提升模型泛化能力。 训练优化: 采用Dice-CE组合损失函数,平衡分割精度和区域连续性 使用余弦退火学习率调度策略 支持混合精度训练 应用流程 训练阶段:系统自动从指定目录加载图像和掩码数据,进行预处理和增强后训练模型。 推理阶段:用户可通过可视化界面选择感兴趣区域,系统实时返回分割结果,并支持结果可视化展示。 该系统特别适用于医学影像分析场景,如器官分割、病变区域检测等任务,其交互式特性使得在专业医疗场景下能够实现更精准的分割效果。项目代码结构清晰,包含完整的数据处理、模型训练和推理预测模块,便于二次开发和实际部署。

2025-06-02

基于人工智能算法实现的AI五子棋博弈

本项目实现了一个完整的五子棋游戏系统,包含游戏界面、交互逻辑和人工智能对战功能。 系统采用Python语言开发,使用Pygame库进行图形界面渲染,实现了三种游戏模式:人人对战、人机对战和AI对战。 AI算法基于博弈树搜索和评估函数,能够提供较强的对战能力。

2025-05-29

计算机视觉项目:Swin-Transformer 【tiny、small、base】模型实现的图像识别项目:17种枸杞病害分类

计算机视觉项目:Swin-Transformer 【tiny、small、base】模型实现的图像识别项目:17种枸杞病害分类 【项目简介】 代码主干网络采用Swin-Transformer 家族系列,包括【tiny、small、base】三种模型。pretrained和freeze_layers参数为是否采用官方预训练模型和是否仅训练分类头。为了做对比消融试验,优化器采用了Adam和SGD、AdamW三种。损失函数采用多类别的交叉熵、学习率优化策略采用cos余弦退火算法 【评估网络】 评估的指标采用loss和准确率(accuracy),分别会在训练集和验证集上进行评估、输出、绘制曲线图像。同时会在训练集、验证集进行一系列评估,包含混淆矩阵、recall、precision、F1 score等等曲线图像,以及recall、precision、F1 score、特异度的输出信息等等。 【具体各类别的指标在json文件中查看】 【如果想要更换数据集训练,参考readme文件】 【本项目为17种枸杞虫害分类(约7k张数据),包含数据集和标签,可以一键运行】

2025-06-02

基于 DenseNet改进TripletAttention三重注意力机制模块实现的17种枸杞虫害识别分类

【介绍】网络采用DenseNet 融合TripletAttention三重注意力机制模块,包含数据集和完整代码 1. 训练过程优化器有Adam和SGD。损失函数采用多类别的交叉熵。学习率优化策略采用cos余弦退火算法 2. 验证集的评估会在训练同时完成,训练脚本会对训练集和验证集同时评估,指标有loss、准确率、混淆矩阵、recall、precision、F1 score、特异度等,并返回对应的曲线图像。也可以根据个人需要绘制不同曲线,请参考训练日志json文件 3. 推理脚本可以对目录下所有数据进行推理 4. 更换数据集,参考readme文件,按照要求摆放好数据即可 【改进】 代码在DenseNet最后加入了TripletAttention模块。为了方便,想要更好别的模块,只需要将TripletAttention替换即可 本项目数据集为【17种枸杞虫害识别】,可以一键运行 更多分类、分割改进:https://blog.youkuaiyun.com/qq_44886601/category_12803200.html https://blog.youkuaiyun.com/qq_44886601/category_12858320.html

2025-06-02

TransUNet智能图像分割系统:训练、推理与可视化一体化平台 【TransUNet+SA+特征金字塔注意力模块和TransUNet】

# 高级图像分割系统介绍 本项目实现了一个基于PyQt5和TransUNet的高级图像分割系统,集成了深度学习模型训练与可视化推理功能。系统采用TransUNet架构,结合了CNN的局部特征提取能力和Transformer的全局建模优势,能够高效完成医学影像、遥感图像等复杂场景的语义分割任务。 系统由三个核心模块组成: 1. **模型训练模块**:支持自定义数据集训练,实现了数据增强、学习率衰减、混合损失函数(Dice+交叉熵)等优化策略,并提供训练曲线可视化功能。 2. **模型推理模块**:基于PyQt5开发了用户友好的GUI界面,支持图像上传、实时分割、结果可视化(原始图像、分割结果、叠加效果)和结果保存。 3. **模型架构**:包含标准TransUNet和改进版My_TransUNet,后者创新性地引入了空间注意力机制和特征金字塔注意力模块,增强了模型对关键特征的捕捉能力。 技术亮点包括: - 采用混合精度训练加速模型收敛 - 实现动态类别处理,自动识别数据集的类别数量 - 提供丰富的评估指标(mIoU、Dice、F1等) - 支持多类别彩色可视化,不同类别用鲜明颜色区分 该系统适用于医学图像分析、自动驾驶场景理解、遥感图像解译等多个领域,具有模型精度高、界面友好、扩展性强等特点。用户可通过简单的点击操作完成从数据准备到模型应用的全流程,极大降低了深度学习技术的使用门槛。

2025-06-02

基于 EfficientNet 卷积网络实现的计算机视觉项目系统:农作物虫害识别

基于 EfficientNet 卷积网络实现的计算机视觉项目系统:农作物虫害识别 【项目简介】分类网络采用EfficientNet 家族系列,包括b0,b1,b2,b3,b4,b5,b6,b7种模型。pretrained和freeze_layers参数可以选择是否载入官方权重和是否只训练分类层。优化器提供了Adam和SGD、AdamW三种。损失函数采用多类别的交叉熵、学习率优化策略采用cos余弦退火算法 【评估网络】评估指标有loss和准确率,分别会在训练集和验证集上进行评估、输出、绘制曲线图像。同时会在训练集、验证集进行一系列评估,包含混淆矩阵、recall、precision、F1 score等等曲线图像,以及recall、precision、F1 score、特异度的输出信息等等。 【如果想要更换数据集训练,参考readme文件,更多分类改进:https://blog.youkuaiyun.com/qq_44886601/category_12803200.html】 【本项目为17种农作物虫害识别(约6k张数据),包含数据集和标签,可以一键运行】

2025-06-02

基于深度学习 Resnet 网络图像分类实战:枸杞病害图像分类

【分类介绍】 网络采用resnet家族 1.训练的时候根据需要进行迁移学习或者只训练分类层;为了做对比消融试验,优化器采用了Adam和SGD,也可以自行添加;损失函数采用多类别的交叉熵、学习率优化策略采用cos余弦退火算法 2. 验证集的评估会在训练同时完成,训练脚本会对训练集和验证集同时评估,指标有loss、准确率、混淆矩阵、recall、precision、F1 score、特异度等,并返回对应的曲线图像。也可以根据个人需要绘制不同曲线,请参考训练日志json文件 3. 推理的时候将图片放在指定目录即可 4. 想要更换数据集,参考readme文件,按照要求摆放好数据即可 本项目数据集为17种枸杞病害图像分类,可以一键运行 更多分类、分割改进:https://blog.youkuaiyun.com/qq_44886601/category_12803200.html

2025-06-02

深度学习基于PyTorch的U-ResNet图像分割模型实现:坐标注意力机制与上采样技术的应用了文档的核心内容

内容概要:本文介绍了一种基于PyTorch实现的UResNet深度学习模型。该模型结合了U-Net和ResNet的优点,并引入了Coordinate Attention(坐标注意力机制)来提升模型性能。文章详细展示了模型各部分的构建,包括基本模块(如BasicBlock、BottleNeck、VGGBlock)、上采样模块(Up)、以及主干网络(UResnet)。每个模块都通过卷积层、批归一化层和激活函数等组件进行定义,并在需要时应用坐标注意力机制。最后,文章通过一个简单的测试用例展示了模型的结构和输出尺寸。 适合人群:熟悉PyTorch框架并有一定深度学习基础的研究人员或工程师。 使用场景及目标:①用于图像分割任务,特别是需要高精度边缘检测的应用;②通过引入坐标注意力机制提高模型对特征空间位置信息的关注度,从而改善模型效果;③作为研究或工程项目中的参考实现,帮助开发者理解和优化类似架构的神经网络。 阅读建议:由于代码较为复杂,建议读者先掌握PyTorch的基础语法和常用组件,再逐步理解各个模块的功能及其组合方式。同时,可以尝试修改模型参数或添加新的特性来进行实验,以加深对整个架构的理解。

2025-06-02

深度学习基于PyTorch的UResNet模型实现:结合FPN结构的图像分割与特征增强系统设计以下要素:

内容概要:本文介绍了一个结合U-Net和ResNet架构的深度学习模型(UResnet),并集成了特征金字塔网络(FPN)。模型主要由卷积块(VGGBlock)、残差块(BasicBlock和BottleNeck)、上采样模块(Up)以及FPN模块组成。UResnet通过编码器-解码器结构进行特征提取与融合,其中编码器部分采用ResNet结构逐步下采样,解码器部分则通过跳跃连接将不同层次的特征图拼接起来,并利用FPN进一步增强多尺度特征表达能力。最后,模型输出经过1x1卷积层映射到所需的类别数。文章还提供了测试代码,用于验证模型输入输出尺寸的一致性。 适合人群:有一定深度学习基础,特别是熟悉PyTorch框架和图像分割任务的研发人员或研究人员。 使用场景及目标:①适用于医学影像分析、遥感图像处理等领域的语义分割任务;②研究者可以通过此模型深入理解U-Net、ResNet及FPN的工作机制及其在图像分割中的应用;③开发者可以基于此模型快速搭建和调试自己的图像分割系统。 阅读建议:由于该模型涉及多个复杂组件,建议读者先掌握基本的神经网络概念如卷积操作、池化、跳远连接等,再逐步深入理解每个模块的设计思想和实现细节。同时,读者应尝试运行提供的测试代码,通过实际操作加深对整个模型架构的理解。

2025-06-02

遥感图像数据集:航拍下的枯树图像语义分割数据集(约400张数据和标签,已处理,单类别图像分割)

【2类别的分割】0 背景 255 枯木 查看classes文件 数据集介绍:【已经划分好】 训练集:images图片目录+masks模板目录,300张左右图片和对应的mask图片 验证集:images图片目录+masks模板目录,130张左右图片和对应的mask图片 除此之外,包含一个图像分割的可视化脚本,随机提取一张图片,将其原始图片、GT图像、GT在原图蒙板的图像展示,并保存在当前目录下 AI改进网络介绍:https://blog.youkuaiyun.com/qq_44886601/category_12858320.html 更多图像分割网络unet、swinUnet、trasnUnet改进,参考改进专栏:https://blog.youkuaiyun.com/qq_44886601/category_12803200.html

2025-05-29

图像分类数据集:坚果图像识别分类【包括划分好的数据、类别字典文件、python数据可视化脚本】

【数据集详情】data目录下分为2个目录,train为训练集、val为验证集,存放各自的同一类数据图片。train数据总数1100,val数据总数50。可以用作yolov5的分类数据集。为了方便查看数据,提供了可视化py文件,随机传入4张图片即可展示,并且保存在当前目录。 关于神经网络改进:https://blog.youkuaiyun.com/qq_44886601/category_12858320.html 类别10: "{ "0": "almonds", "1": "brazil nuts", "2": "cashews", "3": "coconut", "4": "hazelnuts", "5": "macadamia", "6": "pecans", "7": "pine nuts", "8": "pistachios", "9": "walnuts" }

2025-05-29

操作系统Linux常用命令手册:文件操作、系统管理、网络配置及软件包管理指南

内容概要:本文档是一份详细的Linux常用命令手册,涵盖了文件与目录操作、文件权限与属性、系统信息与管理、网络相关、压缩与归档、用户与权限、软件包管理及其他实用命令等多方面内容。每个分类下列举了多个具体命令及其使用示例,如ls用于列出目录内容、chmod修改文件权限、top实时监控系统、ping测试网络连通性等。此外,还介绍了快捷操作组合键的功能。; 适合人群:适合初学者以及需要快速查阅Linux命令的中高级用户。; 使用场景及目标:①帮助用户掌握Linux环境下基本的操作命令;②为日常运维、开发环境搭建提供便捷的命令查询手册;③提高用户在Linux系统下的工作效率。; 阅读建议:由于本文档内容丰富且命令较多,在初次阅读时可以先浏览各个分类标题,对Linux命令有一个宏观的认识,之后再根据实际需要深入学习具体的命令用法。同时,可以通过实践操作加深理解和记忆。

2025-05-29

手势图像目标检测数据【已标注,约700张数据和标签,YOLO 标注格式】

类别个数【7】:fist one two three【具体参考classes文件】 数据集做了7:3训练集、验证集划分。 yolov5的改进实战:https://blog.youkuaiyun.com/qq_44886601/category_12605353.html 【更多图像分类、图像分割(医学)、目标检测(yolo)的项目以及相应网络的改进,可以参考本人主页:https://blog.youkuaiyun.com/qq_44886601/category_12803200.html】

2025-06-12

基于Transformer-Unet对腹部多脏器(13+1类别)的实战分割、包含代码、数据、训练结果

基于Transformer-Unet对腹部多脏器的实战分割、包含代码、数据、训练结果 global correct: 0.9881 precision: ['0.9930', '0.9653', '0.9447', '0.9456', '0.8626', '0.8249', '0.9715', '0.9547', '0.9285', '0.8862', '0.7844', '0.8250', '0.6903', '0.6778'] recall: ['0.9946', '0.9629', '0.9289', '0.9399', '0.8278', '0.6833', '0.9729', '0.9265', '0.9263', '0.8522', '0.7127', '0.7678', '0.5549', '0.4758'] IoU: ['0.9877', '0.9306', '0.8810', '0.8917', '0.7314', '0.5968', '0.9459', '0.8875', '0.8646', '0.7681', '0.5960', '0.6603', '0.4443', '0.3880'] mean IoU: 0.7553 类别: { "0": "background", "1": "spleen", "2": "right kidney", "3": "left kidney", "4": "gallbladder", "5": "esophagus", "6": "liver", "7": "stomach", "8": "aorta", "9": "IVC",等

2025-06-11

人脸面部图像语义分割数据集(约5000张数据和标签,已处理完可以直接训练,多类别图像分割)

【18个人脸部位类别的分割,查看classes文件】 数据集介绍:【已经划分好】 训练集:images图片目录+masks模板目录,3500张左右图片和对应的mask图片 验证集:images图片目录+masks模板目录,1500张左右图片和对应的mask图片 除此之外,包含一个图像分割的可视化脚本,随机提取一张图片,将其原始图片、GT图像、GT在原图蒙板的图像展示,并保存在当前目录下 AI改进网络介绍:https://blog.youkuaiyun.com/qq_44886601/category_12858320.html 更多图像分割网络unet、swinUnet、trasnUnet改进,参考改进专栏:https://blog.youkuaiyun.com/qq_44886601/category_12803200.html

2025-06-11

医学图像分类数据集:基于spine骨折的图像识别分类【包括划分好的数据、类别字典文件、python数据可视化脚本】

【数据集详情】data目录下分为2个目录,train为训练集、val为验证集,存放各自的同一类数据图片。train数据总数3800,val数据总数400。可以用作yolov5的分类数据集。为了方便查看数据,提供了可视化py文件,随机传入4张图片即可展示,并且保存在当前目录。 关于神经网络改进:https://blog.youkuaiyun.com/qq_44886601/category_12858320.html 类别2: { "0": "fracture", "1": "normal" }

2025-06-11

yolov8 实现的工地起重机(塔吊)图像检测完整项目python实现(毕业设计&课程设计&项目开发)、已经训练完成

yolov8 实现的工地起重机(塔吊)图像检测完整项目python实现(毕业设计&课程设计&项目开发)、已经训练完成 【数据集介绍】类别个数(1):起重机(共约3000张数据和标签) 训练结果: epoch,time,train/box_loss,train/cls_loss,train/dfl_loss,metrics/precision(B),metrics/recall(B),metrics/mAP50(B),metrics/mAP50-95(B),val/box_loss,val/cls_loss,val/dfl_loss,lr/pg0,lr/pg1,lr/pg2 100,1327.35,0.48111,0.44115,1.12619,0.88354,0.76705,0.88961,0.72535,0.72615,0.60775,1.27686,3.98e-05,3.98e-05,3.98e-05 训练自定义数据集摆放好数据后,更改mydata.yaml文件即可。训练或者推理的话,根据目标下编写的train和predict脚本实现即可。本项目还提供了预训练权重,可以根据不同的检测任务进行微调以达到好的检测精度。 关于yolov5改进介绍、或者如何训练,请参考: https://blog.youkuaiyun.com/qq_44886601/category_12605353.html yolov8训练数据的介绍: https://blog.youkuaiyun.com/qq_44886601/article/details/139810906

2025-06-10

起重机crane图像目标检测数据【已标注,约2900张数据和标签,YOLO 标注格式】

起重机crane图像目标检测数据【已标注,约2900张数据和标签,YOLO 标注格式】 类别个数【1】:起重机crane【具体参考classes文件】 数据集做了训练集、验证集划分。 yolov5的改进实战:https://blog.youkuaiyun.com/qq_44886601/category_12605353.html 【更多图像分类、图像分割(医学)、目标检测(yolo)的项目以及相应网络的改进,可以参考本人主页:https://blog.youkuaiyun.com/qq_44886601/category_12803200.html】

2025-06-10

基于 MobileNet和EfficientNet轻量级网络实现的自适应迁移学习图像识别实战:9种混凝土骨料颗粒识别【包含数据集、训练结果】

该项目是一个基于MobileNet V3模型的图像分类系统,旨在通过深度学习技术实现高效的图像分类任务。系统主要由三个模块组成:模型训练、推理预测和工具函数。首先,train.py脚本负责模型的训练过程,用户可以通过命令行参数设置模型类型、优化器、学习率、批量大小等超参数。训练过程中,脚本会自动进行数据预处理、模型初始化、训练与验证循环,并保存最佳模型权重和训练日志。训练结束后,系统会生成损失曲线、准确率曲线、混淆矩阵、recall、F1、precision、ROC曲线和AUC值等可化结果,帮助用户评估模型性能。 关于AI改进参考:https://blog.youkuaiyun.com/qq_44886601/category_12858320.html

2025-06-09

图像分类数据集:混凝土骨料粒度图像识别分类【包括划分好的数据、类别字典文件、python数据可视化脚本】

【数据集详情】data目录下分为2个目录,train为训练集、val为验证集,存放各自的同一类数据图片。train数据总数600,val数据总数270。可以用作yolov5的分类数据集。为了方便查看数据,提供了可视化py文件,随机传入4张图片即可展示,并且保存在当前目录。 关于神经网络改进:https://blog.youkuaiyun.com/qq_44886601/category_12858320.html 类别9: { "0": "A16", "1": "A32", "2": "A8", "3": "B16", "4": "B32", "5": "B8", "6": "C16", "7": "C32", "8": "C8" }

2025-06-09

深度学习基于ShuffleNetV2和CAM模块的图像分类模型设计:改进特征表达与分类性能

内容概要:本文介绍了一个改进的ShuffleNetV2深度学习模型,该模型加入了通道注意力机制(Channel Attention Module,CAM)。首先定义了CAM类,它通过平均池化和最大池化两种方式提取特征,再经过全连接层和激活函数处理后加权融合输入特征图。接着定义了ShuffleNetV2_CAM类,在原ShuffleNetV2基础上移除了原有的全连接层,替换成自定义的CAM模块,最后接上新的用于分类的全连接层。文中还提供了创建模型以及测试模型输出尺寸的代码片段。; 适合人群:对深度学习有一定了解,尤其是熟悉PyTorch框架的开发者或研究人员。; 使用场景及目标:①研究通道注意力机制在图像分类任务中的应用效果;②基于ShuffleNetV2架构进行改进以提高模型性能;③学习如何在已有模型中插入自定义模块来增强模型能力。; 阅读建议:此资源主要面向有一定深度学习基础的人群,重点在于理解CAM的工作原理及其与ShuffleNetV2结合的方式,读者应具备PyTorch编程经验,以便更好地理解和复现代码。

2025-06-09

ResUNet+SSPP+CAM+联合损失改进:腹部脊椎图像分割数据集(2类图像分割任务)

代码实现了一个基于UNet架构的医学图像分割系统,支持标准UNet模型,能够自动处理CT等医学影像数据的分割任务。 系统采用PyTorch框架构建,包含完整的数据加载、模型训练、评估和可视化功能,使用交叉熵损失函数和AdamW优化器进行训练,并通过余弦退火策略调整学习率。训练过程中会计算Dice系数、IoU、精确率、召回率等指标,并将结果以JSON格式保存,同时提供损失曲线、学习率衰减曲线等多维度可视化功能。 代码通过命令行参数灵活配置,支持自定义输入尺寸、批次大小等超参数,能够自动分析掩码图像确定分割类别数,并保存最佳模型权重,为医学图像分割任务提供了完整的解决方案。同事提供了美观的可视化推理界面,可以一键推理。 【改进策略】1.加入SSPP模块 2.加入CAM注意力模块 3.采用多类别的交叉熵和dice 损失 指标如下:【在人体脊椎数据集上训练了30轮】 train loss:0.1104 train mean iou:0.8652 train mean dice:0.9277 val loss:0.1113 val mean iou:0.8677 val mean dice:0.9292 更多unet、swinUnet改进:https://blog.youkuaiyun.com/qq_44886601/category_12858320.html

2025-06-09

深度学习基于MobileNetV2和SSPP的空间金字塔池化卷积神经网络图像分类模型实现

内容概要:本文介绍了一个基于PyTorch深度学习框架的卷积神经网络模型MobileNetV2_SSPP。首先定义了空间金字塔池化层SSPP模块,它接收输入通道数量和池化级别列表作为参数,在初始化过程中构建不同级别的自适应平均池化层,前向传播时对输入特征图进行多尺度池化并展平连接。接着创建cnn_model函数用于生成最终模型实例,内部嵌套定义MobileNetV2_SSPP类继承自nn.Module,组合MobileNetV2主干网络特征提取部分与SSPP层,并添加全连接分类器。最后在主程序中实例化模型对象并测试输入输出形状。; 适合人群:有一定深度学习理论基础,熟悉PyTorch框架的开发者或研究人员。; 使用场景及目标:①研究空间金字塔池化技术及其在图像分类任务中的应用;②基于MobileNetV2改进模型结构以适应不同尺寸输入图片的分类需求。; 阅读建议:本代码示例聚焦于特定模型架构的设计与实现,读者应具备扎实的深度学习基础知识和PyTorch编码能力,建议结合相关理论文献深入理解各组件的工作原理。

2025-06-06

医学图像分割数据:脊椎二值图像切片分割【包含3个切面的切片数据、可视化代码、二值分割】

医学图像分割数据:脊椎二值图像切片分割【包含3个切面的切片数据、可视化代码、二值分割】 【其中mask中、0为背景,1脊椎等2类别】 数据集:分别从轴位面(横端面)、冠状面、矢状面切分出2D图像。为了方便分割,这里切片的时候去除了ROI区域不足3%的数据,并且做了Windowing增强,全部缩放为256*256大小,并且标签做了二值化处理,脊椎区域全部处理为255灰度值。为了方便观察mask,提供了可视化代码(show.py) 数据集介绍:分为x、y、z轴的切面图像 x轴:images图片目录+masks模板目录,468张图片和468个对应的mask图片 y轴:images图片目录+masks模板目录,1037张图片和1037个对应的mask图片 z轴:images图片目录+masks模板目录,1501张图片和1501个对应的mask图片 【更多医学图像分割代码及改进,参考本人专栏:https://blog.youkuaiyun.com/qq_44886601/category_12858320.html】

2025-06-05

图像数据集:马路上的斑马线、停止线图像语义分割数据集(约2500张数据和标签,已处理,多类别图像分割)

【3类别的分割,查看classes文件】 0 background 1 crosswalk 2 stop-line 数据集介绍:【已经划分好】 训练集:images图片目录+masks模板目录,1800张左右图片和对应的mask图片 验证集:images图片目录+masks模板目录,800张左右图片和对应的mask图片 除此之外,包含一个图像分割的可视化脚本,随机提取一张图片,将其原始图片、GT图像、GT在原图蒙板的图像展示,并保存在当前目录下 AI改进网络介绍:https://blog.youkuaiyun.com/qq_44886601/category_12858320.html 更多图像分割网络unet、swinUnet、trasnUnet改进,参考改进专栏:https://blog.youkuaiyun.com/qq_44886601/category_12803200.html

2025-06-05

深度学习基于U-Net和ResNet的语义分割模型:带有DLKA模块的UResNet网络设计与实现

内容概要:本文详细介绍了UResNet模型的构建与实现。UResNet是一种结合了ResNet和UNet结构的深度学习模型,主要用于图像分割任务。该模型由多个模块组成,包括上采样模块(Up)、基础块(BasicBlock)、瓶颈块(BottleNeck)、VGG块(VGGBlock)以及可选的膨胀大核注意力模块(DLKA)。DLKA模块通过大核分支、小核分支和通道注意力机制来增强特征表示能力。UResNet的主干部分采用ResNet风格的残差连接,并在编码器-解码器架构中引入跳跃连接,从而有效融合多尺度信息。最后通过卷积层输出分类结果。; 适合人群:具备一定深度学习基础,特别是对卷积神经网络有一定了解的研发人员或学生。; 使用场景及目标:①研究和开发医学影像、遥感图像等领域的图像分割应用;②探索基于ResNet和UNet架构改进的新型网络设计;③理解DLKA模块的工作原理及其在提升模型性能方面的作用。; 阅读建议:由于该模型涉及较多的PyTorch代码实现细节,建议读者首先熟悉PyTorch框架的基本用法,同时关注各组件的功能及其之间的联系,在实践中逐步掌握整个网络的设计思路。此外,对于DLKA模块的理解可以帮助读者更好地优化模型性能。

2025-06-05

person、smoke图像目标检测数据【已标注,约2200张数据和标签,YOLO 标注格式】

person、smoke图像目标检测数据【已标注,约2200张数据和标签,YOLO 标注格式】 类别个数【2】:person、smoke等【具体参考classes文件】 数据集做了训练集、验证集划分。 yolov5的改进实战:https://blog.youkuaiyun.com/qq_44886601/category_12605353.html 【更多图像分类、图像分割(医学)、目标检测(yolo)的项目以及相应网络的改进,可以参考本人主页:https://blog.youkuaiyun.com/qq_44886601/category_12803200.html】

2025-06-05

基于CBAM注意力机制的ResNet图像分类实战​

​​技术解析 | 基于CBAM注意力机制的ResNet图像分类实战​​ 在计算机视觉领域,图像分类作为基础任务,其性能提升一直是研究热点。今天为大家分享一套融合CBAM注意力机制的ResNet实战方案,通过代码级解析展示如何实现高效分类。 ​​注意力机制增强​​ 创新性地在ResNet各层级嵌入CBAM模块(通道+空间注意力双机制) 通道注意力通过Avg/Max双路聚合特征重要性 空间注意力采用7×7卷积捕捉位置关系 支持ResNet18-152全系列模型切换 提供权重冻结/微调策略(冻结backbone仅训练CBAM+FC层) 余弦退火学习率优化训练稳定性 ​​全维度评估体系​​ 四重指标监控:Precision/Recall/Specificity/F1 动态混淆矩阵可视化(支持类别不平衡分析) FLOPs计算与参数量统计(1.2M可训练参数@ResNet18)

2025-06-05

图像数据集:汽车损坏图像语义分割数据集(约400张数据和标签,已处理,多类别图像分割)

【9类别的分割】0 background 1 crack-hole 2 damage 3 medium_deformation 4 medium_scratch 5 severe_deformation 6 severe_scratch 7 slight_deformation 8 slight_scratch 查看classes文件 数据集介绍:【已经划分好】 训练集:images图片目录+masks模板目录,300张左右图片和对应的mask图片 验证集:images图片目录+masks模板目录,80张左右图片和对应的mask图片 除此之外,包含一个图像分割的可视化脚本,随机提取一张图片,将其原始图片、GT图像、GT在原图蒙板的图像展示,并保存在当前目录下 AI改进网络介绍:https://blog.youkuaiyun.com/qq_44886601/category_12858320.html 更多图像分割网络unet、swinUnet、trasnUnet改进,参考改进专栏:https://blog.youkuaiyun.com/qq_44886601/category_12803200.html

2025-06-04

图像分类数据集:小狗情绪图像识别分类【包括划分好的数据、类别字典文件、python数据可视化脚本】

【数据集详情】data目录下分为2个目录,train为训练集、val为验证集,存放各自的同一类数据图片。train数据总数2800,val数据总数1200。可以用作yolov5的分类数据集。为了方便查看数据,提供了可视化py文件,随机传入4张图片即可展示,并且保存在当前目录。 关于神经网络改进:https://blog.youkuaiyun.com/qq_44886601/category_12858320.html 类别4: { "0": "angry", "1": "happy", "2": "relaxed", "3": "sad" }

2025-06-03

UNet、UNet++和UNet3+三种主流分割网络架构的智能医学图像分割系统

在医学影像分析和计算机视觉领域,图像分割技术正发挥着越来越重要的作用。我们推出的智能医学图像分割系统,基于先进的深度学习算法,为临床诊断、科研分析和教学演示提供了强大的技术支持。该系统集成了训练、验证和可视化功能于一体,具有以下显著优势: 1.系统采用模块化设计,支持UNet、UNet++和UNet3+三种主流分割网络架构。用户可根据不同任务需求灵活选择模型,UNet系列网络以其优异的医学图像分割性能著称,特别适合处理器官、肿瘤等医学目标的精确分割。通过深度卷积和跳跃连接结构,系统能够有效捕捉多尺度特征,实现像素级的高精度分割。 2.智能化训练流程:系统提供完整的端到端训练解决方案: 自动数据预处理:支持CT窗宽窗位调整、数据增强等医学影像专用处理 3.智能标签管理:自动分析标注图像的灰度值分布,动态确定输出类别。自适应学习率调整:采用余弦退火策略优化训练过程 4.全面评估指标:提供Dice系数、IoU、精确率、召回率等多维度评估 5.专业级可视化界面:基于PyQt5开发的图形界面简洁直观:三视图对比展示:原始图像、分割结果和叠加效果同屏显示。专业色彩渲染:使用红色高亮显示分割区域,支持透明度调节,响应式设计:适配不同分辨率图像,保持最佳显示效果 6.高性能推理引擎:支持CPU/GPU自动切换,兼容多种硬件环境 采用内存映射和批量处理技术,大幅提升推理速度 平均单次推理时间控制在毫秒级,满足实时性要求 全面的结果分析 系统提供详尽的训练过程监控和结果分析: 动态绘制损失曲线、精度曲线等10余种训练指标 生成混淆矩阵和分类报告,支持结果回溯 自动保存最佳模型和最终模型,方便部署应用 应用场景 放射科:肺部CT结节分割、脑部MRI组织分割 病理科:细胞核分割、组织区域划分 外科手术规划:器官体积测量、三维重建 医学研究:影像组学特征提取、定量分析

2025-06-03

​​高效图像分类解决方案:基于EfficientNetV2的深度学习模型​​

在当今人工智能蓬勃发展的时代,图像分类技术已成为计算机视觉领域的核心基础。我们隆重推出这套基于EfficientNetV2架构的深度学习解决方案,该方案通过模块化设计和自动化流程,显著提升了图像分类任务的开发效率与模型性能。 ​​【技术亮点​​】 ​​前沿模型架构​​ 采用EfficientNetV2系列模型(S/M/L三种规格),该架构通过复合缩放策略和渐进式训练方法,在ImageNet数据集上实现了SOTA性能。我们的实现支持迁移学习,可快速适配各类细分场景。 ​​全流程自动化​​ 智能数据预处理:集成随机旋转、中心裁剪等增强技术 自适应学习率调度:采用余弦退火算法动态调整学习率 自动化评估体系:实时生成混淆矩阵及PRSF指标曲线 智能权重管理:自动保存最佳和最终模型权重 ​​专业评估体系​​ 系统提供多维度的评估指标: 基础指标:准确率、损失曲线 高级统计:类别级精确率、召回率、特异性 可视化分析:训练过程动态可视化、LR衰减曲线 混淆矩阵:支持训练集/验证集双维度分析 ​​应用优势​​ ​​工业级鲁棒性​​ 完善的异常处理机制 自动设备检测(支持GPU加速) 内存优化设计(支持大批次训练) ​​灵活部署方案​​ 提供完整训练pipeline和独立推理模块 支持PyTorch模型权重直接加载 兼容多种输出格式(JSON/图像/日志) ​​可解释性增强​​ 类激活可视化 预测结果概率分布展示 支持top-k类别输出 ​​应用场景​​ 本方案特别适用于: 医疗影像分析(病灶分类) 工业质检(缺陷检测) 零售行业(商品识别) 安防领域(行为识别) 农业应用(作物病害识别) ​​

2025-06-03

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除