crazy121121-优快云博客

原创基于融合CBAM注意力机制的ResNet50改进模型图像分类

本文提出了一种基于CBAM注意力机制的ResNet50改进模型。主要实现包括：1) 定义了包含通道注意力和空间注意力的CBAM模块；2) 修改ResNet50的Bottleneck结构，在conv3后插入CBAM模块；3) 使用PyTorch实现了完整的训练流程，包括数据增广、混合精度训练和学习率调度；4) 添加Grad-CAM可视化功能以解释模型决策。实验结果表明，该模型在三分类任务上表现良好，并可通过热力图直观展示分类依据。代码提供了完整的训练框架，包括损失监控、准确率计算和混淆矩阵展示。

2025-06-23 12:47:49 726

原创 YOLO训练数据集标注格式转换：txt转xml；xml转txt；

本文介绍了两种标注格式转换工具的实现代码：1) XML转YOLO格式工具，解析PASCAL VOC格式的XML文件，提取对象类别和边界框信息，转换为YOLO所需的相对坐标格式；2) YOLO转XML工具，读取YOLO格式的标注文件，结合原始图像尺寸，重新构建符合PASCAL VOC标准的XML结构。两个工具均支持批量处理，自动创建输出目录，并包含错误处理机制，适用于计算机视觉数据集的格式转换需求。代码展示了标注信息在不同格式间的转换逻辑和坐标系的相互换算方法。

2025-06-23 12:35:37 424 1

原创 Python绘制表格数据线性对比图

本文介绍了如何使用Python代码生成算法训练结果的线性结果对比图，适用于论文中展示实验效果。

2024-08-26 17:19:52 569

原创 OpenCV实现俯卧撑实时计数（Python）

本文主要是基于OpenCV实现了视频与摄像头中人体俯卧撑实时计数

2024-08-23 16:20:10 827

原创视频文件中提取特定帧图像+QT界面源码

在对视频进行处理或者检测时，往往会遇到需要对视频中某一特定帧图像进行提取。博主在此分享一下本人创作的对视频文件中提取特定帧图像+QT界面源码，包含从视频开头截取第几帧和从结尾提取第几帧。

2024-08-21 12:58:27 1015

原创《计算机工程与应用》期刊最新全流程投稿经验分享（2024.08.20）

《计算机工程与应用》期刊最新全流程投稿经验分享（2024.08.20）

2024-08-20 20:41:17 11502 132

crazy121121的博客

原创基于融合CBAM注意力机制的ResNet50改进模型图像分类

原创 YOLO训练数据集标注格式转换：txt转xml；xml转txt；

原创 Python绘制表格数据线性对比图

原创 OpenCV实现俯卧撑实时计数（Python）

原创视频文件中提取特定帧图像+QT界面源码

原创《计算机工程与应用》期刊最新全流程投稿经验分享（2024.08.20）

空空如也

空空如也

原创 基于融合CBAM注意力机制的ResNet50改进模型图像分类

原创 YOLO训练数据集标注格式转换：txt转xml；xml转txt；

原创 Python绘制表格数据线性对比图

原创 OpenCV实现俯卧撑实时计数（Python）

原创 视频文件中提取特定帧图像+QT界面源码

原创 《计算机工程与应用》期刊最新全流程投稿经验分享（2024.08.20）

空空如也

空空如也

原创基于融合CBAM注意力机制的ResNet50改进模型图像分类

原创视频文件中提取特定帧图像+QT界面源码

原创《计算机工程与应用》期刊最新全流程投稿经验分享（2024.08.20）