- 博客(6)
- 收藏
- 关注
原创 基于融合CBAM注意力机制的ResNet50改进模型图像分类
本文提出了一种基于CBAM注意力机制的ResNet50改进模型。主要实现包括:1) 定义了包含通道注意力和空间注意力的CBAM模块;2) 修改ResNet50的Bottleneck结构,在conv3后插入CBAM模块;3) 使用PyTorch实现了完整的训练流程,包括数据增广、混合精度训练和学习率调度;4) 添加Grad-CAM可视化功能以解释模型决策。实验结果表明,该模型在三分类任务上表现良好,并可通过热力图直观展示分类依据。代码提供了完整的训练框架,包括损失监控、准确率计算和混淆矩阵展示。
2025-06-23 12:47:49
726
原创 YOLO训练数据集标注格式转换:txt转xml;xml转txt;
本文介绍了两种标注格式转换工具的实现代码:1) XML转YOLO格式工具,解析PASCAL VOC格式的XML文件,提取对象类别和边界框信息,转换为YOLO所需的相对坐标格式;2) YOLO转XML工具,读取YOLO格式的标注文件,结合原始图像尺寸,重新构建符合PASCAL VOC标准的XML结构。两个工具均支持批量处理,自动创建输出目录,并包含错误处理机制,适用于计算机视觉数据集的格式转换需求。代码展示了标注信息在不同格式间的转换逻辑和坐标系的相互换算方法。
2025-06-23 12:35:37
424
1
原创 视频文件中提取特定帧图像+QT界面源码
在对视频进行处理或者检测时,往往会遇到需要对视频中某一特定帧图像进行提取。博主在此分享一下本人创作的对视频文件中提取特定帧图像+QT界面源码,包含从视频开头截取第几帧和从结尾提取第几帧。
2024-08-21 12:58:27
1015
原创 《计算机工程与应用》期刊最新全流程投稿经验分享(2024.08.20)
《计算机工程与应用》期刊最新全流程投稿经验分享(2024.08.20)
2024-08-20 20:41:17
11502
132
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅