- 博客(27)
- 收藏
- 关注
原创 RK3588部署YOLOv8(2):OpenCV和RGA实现模型前处理对比
RK平台上有RGA (Raster Graphic Acceleration Unit) 加速,使用RGA可以减少资源占用、加速图片处理速度。因此,在部署YOLOv8是针对RGA和OpenCV的分别进行了实现,并对性能、速度和资源占用进行对比。
2025-03-07 15:58:01
997
原创 RK3588部署YOLOv8(1):YOLOv8和YOLOv8-pose转ONNX及Python后处理代码实现
对YOLOv8和YOLOv8-pose,使用RKNN官方代码转ONNX,主要用于在RK3588上的模型部署,方便后续ONNX转RKNN,可以使用RK官方代码一键转换+部署。
2025-02-26 15:39:42
1210
原创 YOLOv8源码修改(4)- YOLOv8剪枝(实现任意YOLO模型的简单剪枝)
使用torch-pruning进行YOLO模型的剪枝,简单易操作,无需关注模型实现和剪枝算法。
2025-01-30 00:35:43
2408
8
原创 分类模型训练框架搭建(1):resnet18/50和mobilenetv2在CIFAR10上测试结果
用CIFAR10测试一下自己搭建的分类模型训练框架,包括基本训练、知识蒸馏、模型稀疏化、剪枝微调、模型量化。最终,ResNet18取得96%的分类准确率,且剪枝91%的ResNet18可以取得94%的准确率
2025-01-21 14:21:15
991
原创 ONNX推理warning: TensorRT does not natively support INT64. Attempting to cast down to INT32.
只想用ONNX进行模型推理,加载时报Warning,加载模型时间也特别长。
2024-08-30 23:33:28
187
原创 YOLO后处理trick - 减少nms的计算次数、比较次数和空间消耗
减少YOLO后处理nms的计算和比较次数。优化1:将110,000次的比较优化到9,000次(Python实现和C++实现的对比,网上找的代码,如果是官方一点的,应该也有类似优化)。优化2:将O(NlgN) 的计算复杂度(排序比较+IoU比较)降到接近O(N)(实际效果可能更好,当然不排除特别极端情况下,也会变差,不过这是基于YOLO特性设计的,几乎不可能出现)。
2024-08-27 11:57:43
724
原创 实时手势识别(2)- 基于关键点分类实现零样本图片的任意手势的识别
先使用YOLOv8检测手部区域,然后使用YOLOv8-pose对放大的手部区域检测关键点,最后使用PointNet分类关键点,可以实现对任意手势的高精度实时识别。对于非遮挡手势,仅需1W个参数,即可实现98%的准确率,极限情况下,仅需400个参数,可以达到80%的准确率。
2024-08-19 11:53:17
1246
3
原创 实时手势识别(1)- 基于手部检测+手部分类
利用YOLOv8获取手部区域,然后对手部区域进行分类,实现手势识别。本文使用检测+分类,对于一类手势只需200张训练图片,即可达到99%的准确率。在下一篇基于关键点+关键点分类,无需训练图片,即可实现对任意手势的识别,且达到99%的准确率。
2024-08-17 15:27:20
3911
4
原创 基于YOLOv8-pose的手部关键点检测(3)- 实现实时手部关键点检测
使用YOLOv8-m对图像进行手部检测,然后扩大检测框区域,并对该区域使用YOLOv8-s-pose使用关键点检测,实现实时的手部关键点检测。
2024-08-16 23:57:20
1781
2
原创 基于YOLOv8-pose的手部关键点检测(2)- 模型训练、结果分析和超参数优化
对YOLOv8-pose手部关键点检测模型进行训练,并分析训练结果,从而调优训练超参数。
2024-08-16 11:57:33
2200
9
原创 基于YOLOv8-pose的手部关键点检测(1)- 手部关键点数据集获取(数据集下载、数据清洗、处理与增强)
手部姿态估计、手势识别和手部动作识别等任务时,可以转化为对手部关键点的分布状态和运动状态的估计问题。本文主要给出手部关键点数据集获取的方式。总共获取三个数据集:handpose_v2、HaGRID-pose和hand_keypoint_26K。正样本总计:593,661张图片(53.33W张用于训练,6.04W张用于验证和测试)。
2024-08-14 01:15:22
3837
1
原创 基于YOLOv8的手部检测(2)- 模型训练、结果分析和超参数优化
对YOLOv8手部检测模型进行训练,并分析训练结果,从而调优训练超参数。
2024-08-13 16:14:36
1571
5
原创 基于YOLOv8的手部检测(1)- 手部数据集获取(数据集下载、数据清洗、处理与增强)
在进行手部姿态估计、手势识别时,需要先检测出手的位置。本文对网上公开的手部数据集进行获取、清洗、处理与数据增强,用于YOLO等目标检测网络的训练。
2024-08-12 11:52:07
4765
17
原创 YOLOv8-pose(1)- 关键点检测数据集格式详解+快速训练+预测结果详解
实现YOLOv8-pose的快速使用:yolov8-pose关键点检测数据集的格式、标注与迭代;实现训练一个yolov8-pose模型;输出测试结果与分析。
2024-07-20 03:58:03
15952
19
原创 YOLOv8-pose:官方预训练模型在COCO-pose上的自测结果
在COCO-pose数据集上,更完整的yolov8-pose结果,用于后续实验对比。
2024-07-10 10:08:49
1087
8
原创 COCO目标检测标签转YOLO格式+按需实现标签筛选
COCO标签转YOLO:将下载的训练集标签instances_train2017.json和验证集标签instances_val2017.json转成YOLO格式。
2024-07-05 09:30:53
2042
原创 deepsort修改(3):替换reid特征编码网络
使用paddleclas的pplcnetv2网络替换deepsort中的reid网络。
2024-06-05 14:09:03
1461
1
原创 deepsort修改(2):多类别追踪,id根据类别从1编号
原始deepsort主要用于行人、车辆追踪,因此不区分类别,只给出跟踪id。自己使用的场景中,存在不同类别的物体需要跟踪,希望能够对每一类物体的跟踪id,分别从0开始编号。
2024-06-05 12:12:28
862
2
原创 deepsort修改(1):id跳变优化
思路:存在序列:1, 2, 3, 5, 8, 12...,如何将其修改成:1, 2, 3, 4, 5, 6, ...。本质上,实现的是:{1:1, 2:2, 3:3, 5:4, 8:5, 12:6...}这样一个映射。
2024-06-03 17:06:21
1176
5
原创 YOLOv8源码修改(3)-多个YOLOv8模型 +deepsort 实现多目标跟踪 and 修改原始deepsort结果,加入预测类别和置信度
使用YOLOv8+deep_sort实现多目标跟踪。YOLOv8官方仅提供了bot_sort和byte_tracker两种跟踪算法,而常用的deep_sort并未给出。即使给出,由于高度封装,高耦合度导致自定义使用跟踪结果困难。因此,将YOLOv8只作为检测器使用,再结合deep_sort实现多目标跟踪,并给出获取目标跟踪结果、可视化、保存推理文件等方法。
2024-05-27 01:15:08
2510
7
原创 YOLOv8源码修改(2)- 解耦检测推理类+融合多个YOLOv8模型的检测推理结果
实际工程中,一张图片可能需要经过几个检测网络,不同网络的配置会有差异,且可能只需获取部分预测类别,而YOLOv8高度封装,直接使用较为麻烦。因此,需要解耦YOLOv8检测的推理类,用其直接加载模型,并在不同模型获取部分结果后,融合多个模型的推理结果。
2024-05-26 23:29:18
1873
原创 YOLOv8源码修改(1)- DataLoader增加负样本数据读取+平衡训练batch中的正负样本数
实际工程中,仅仅使用采集到的数据(或者说单一的数据集)进行训练,会导致网络在真实未知的场景下,极其容易发生误检。因此,网络需要见识不同的场景数据才更具有鲁棒性。
2024-05-17 12:10:31
3432
13
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人