【大作业-09】基于YOLOV5的手势识别系统

原创已于 2024-08-09 16:50:55 修改 · 2.6w 阅读

384 ·

CC 4.0 BY-SA版权

文章标签：

#目标检测 #计算机视觉 #人工智能

于 2022-03-05 12:54:42 首次发布

大作业系列专栏收录该内容

68 篇文章

订阅专栏

该文章已生成可运行项目，

毕设系列-基于YOLOV5的手势识别系统

我们之前做过一期基于Yolov5的口罩检测系统（手把手教你使用YOLOV5训练自己的目标检测模型-口罩检测-视频教程_dejahu的博客-优快云博客），里面的代码是基于YOLOV5 6.0开发的，并且是适用其他数据集的，只需要修改数据集之后重新训练即可，非常方便，但是有些好兄弟是初学者，可能不太了解数据的处理，所以我们就这期视频做个衍生系列，主要是希望通过这些系列来教会大家如何训练和使用自己的数据集。

本期我们带来的内容是基于YOLOV5的手势识别系统，我们将会训练得到能识别10种常用手势的模型，废话不多说，还是先看效果。

B站视频：毕设系列-检测专题-基于YOLOV5的手势识别系统_哔哩哔哩_bilibili

代码地址：YOLOV5-hand-42: 基于YOLOV5的手势识别系统 (gitee.com)

数据集和训练好的模型地址： YOLOV5手势识别数据集+代码+模型2000张标注好的数据+教学视频-深度学习文档类资源-优快云文库

考虑到有的朋友算力不足，我这里也提供了标注好的数据集和训练好的模型，获取方式是通过优快云付费下载，资源地址如下：

YOLOV5手势识别数据集+代码+模型2000张标注好的数据+教学视频-深度学习文档类资源-优快云文库

需要远程调试的小伙伴和课程设计订做的小伙伴可以加QQ 3045834499，价格公道，童叟无欺。

下载代码

代码的下载地址是：YOLOV5-hand-42: 基于YOLOV5的手势识别系统 (gitee.com)

配置环境

不熟悉pycharm的anaconda的小伙伴请先看这篇csdn博客，了解pycharm和anaconda的基本操作

如何在pycharm中配置anaconda的虚拟环境_dejahu的博客-优快云博客_如何在pycharm中配置anaconda

anaconda安装完成之后请切换到国内的源来提高下载速度，命令如下：

conda config --remove-key channels
conda config --add channels https://mirrors.ustc.edu.cn/anaconda/pkgs/main/
conda config --add channels https://mirrors.ustc.edu.cn/anaconda/pkgs/free/
conda config --add channels https://mirrors.bfsu.edu.cn/anaconda/cloud/pytorch/
conda config --set show_channel_urls yes
pip config set global.index-url https://mirrors.ustc.edu.cn/pypi/web/simple

首先创建python3.8的虚拟环境，请在命令行中执行下列操作：

conda create -n yolo5 python==3.8.5
conda activate yolo5

pytorch安装（gpu版本和cpu版本的安装）

实际测试情况是YOLOv5在CPU和GPU的情况下均可使用，不过在CPU的条件下训练那个速度会令人发指，所以有条件的小伙伴一定要安装GPU版本的Pytorch，没有条件的小伙伴最好是租服务器来使用。

GPU版本安装的具体步骤可以参考这篇文章：2021年Windows下安装GPU版本的Tensorflow和Pytorch_dejahu的博客-优快云博客

需要注意以下几点：

安装之前一定要先更新你的显卡驱动，去官网下载对应型号的驱动安装
30系显卡只能使用cuda11的版本
一定要创建虚拟环境，这样的话各个深度学习框架之间不发生冲突

我这里创建的是python3.8的环境，安装的Pytorch的版本是1.8.0，命令如下：

conda install pytorch==1.8.0 torchvision torchaudio cudatoolkit=10.2 # 注意这条命令指定Pytorch的版本和cuda的版本
conda install pytorch==1.8.0 torchvision==0.9.0 torchaudio==0.8.0 cpuonly # CPU的小伙伴直接执行这条命令即可
conda install pytorch torchvision torchaudio cudatoolkit=11.3 -c pytorch # 30系显卡的小伙伴执行这里的指令

安装完毕之后，我们来测试一下GPU是否

pycocotools的安装

后面我发现了windows下更简单的安装方法，大家可以使用下面这个指令来直接进行安装，不需要下载之后再来安装

pip install pycocotools-windows

其他包的安装

另外的话大家还需要安装程序其他所需的包，包括opencv，matplotlib这些包，不过这些包的安装比较简单，直接通过pip指令执行即可，我们cd到yolov5代码的目录下，直接执行下列指令即可完成包的安装。

pip install -r requirements.txt
pip install pyqt5
pip install labelme

数据处理

实现准备处理好的yolo格式的数据集，一般yolo格式的数据是一张图片对应一个txt格式的标注文件。

标注文件中记载了目标的类别中心点坐标和宽高信息，如下图所示：

记住这里的数据集位置，在后面的配置文件中我们将会使用到，比如我这里数据集的位置是：C:/Users/chenmingsong/Desktop/hand/hand_gesture_dataset

配置文件准备

数据配置文件的准备

配置文件是data目录下的hand_data.yaml，只需要将这里的数据集位置修改为你本地的数据集位置即可。
模型配置文件的准备

模型的配置文件主要有三个，分别是hand_yolov5s.yaml、hand_yolov5m.yaml、hand_yolov5l.yaml，分别对应着yolo大中小三个模型，主要将配置文件中的nc修改为我们本次数据集对应的10个类别即可。

模型训练

模型训练的主文件是train.py，下面的三条指令分别对应着小中大三个模型的训练，有GPU的同学可以将设备换为0，表示使用0号GPU卡，显存比较大的同学可以将batchsize调整为4或者16，训练起来更快。

python train.py --data hand_data.yaml --cfg hand_yolov5s.yaml --weights pretrained/yolov5s.pt --epoch 100 --batch-size 2 --device cpu
python train.py --data hand_data.yaml --cfg hand_yolov5l.yaml --weights pretrained/yolov5l.pt --epoch 100 --batch-size 2
python train.py --data hand_data.yaml --cfg hand_yolov5m.yaml --weights pretrained/yolov5m.pt --epoch 100 --batch-size 2

训练过程中会出现下面的进度条

等待训练完成之后训练结果将会保存在runs/train目录下，里面有各种各样的示意图供大家使用。

模型使用

模型的使用全部集成在了detect.py目录下，你按照下面的指令指你要检测的内容即可

 # 检测摄像头
 python detect.py  --weights runs/train/exps/weights/best.pt --source 0  # webcam
 # 检测图片文件
  python detect.py  --weights runs/train/exps/weights/best.pt --source file.jpg  # image 
 # 检测视频文件
   python detect.py --weights runs/train/exps/weights/best.pt --source file.mp4  # video
 # 检测一个目录下的文件
  python detect.py --weights runs/train/exps/weights/best.pt path/  # directory
 # 检测网络视频
  python detect.py --weights runs/train/exps/weights/best.pt 'https://youtu.be/NUsoVlDFqZg'  # YouTube video
 # 检测流媒体
  python detect.py --weights runs/train/exps/weights/best.pt 'rtsp://example.com/media.mp4'  # RTSP, RTMP, HTTP stream

比如以我们的口罩模型为例，如果我们执行python detect.py --weights runs/train/exps/weights/best.pt --source data/images/0023.png的命令便可以得到这样的一张检测结果。

0023

构建可视化界面

可视化界面的部分在window.py文件中，是通过pyqt5完成的界面设计，在启动界面前，你需要将模型替换成你训练好的模型，替换的位置在window.py的第60行，修改成你的模型地址即可，如果你有GPU的话，可以将device设置为0，表示使用第0行GPU，这样可以加快模型的识别速度嗷。

现在启动看看效果吧。

找到我

你可以通过这些方式来寻找我。

B站：肆十二-

优快云：肆十二

知乎：肆十二

微博：肆十二-

现在关注以后就是老朋友喽！

本文章已经生成可运行项目

21 条评论

qq_74974421 2025.04.16
40系显卡呢

白皬 2024.09.09
数据集都是需要自己标记的吗？（新手小白）

逆光的流星 2024.05.14
求联系方式学长

K_951833 2024.04.23
博主，这个是用的什么模型

AlenYuh 2023.12.14
请问这个手势数据集是什么数据集呢

lucky rainbow2024 2023.04.29
这个只能在window下跑吗为什么我PyQt下载成功了，但 import PyQt5.QtCore ModuleNotFoundError: No module named 'PyQt5.QtCore'这个错误呢？

AI吃大瓜 2022.09.20
推荐这个，手势识别训练代码和手势识别数据集：https://panjinquan.blog.youkuaiyun.com/article/details/126750433

HZRRRRRRR 2022.08.26
请问一下，这个可以做数字1-5的手势识别吗，要怎么做

恐怖粘贴人 2022.07.19
为什么图片上传之后，开始检测就卡死呢，环境啥的我就pycocotools没安装好，其他应该没啥问题
- 大梦汤普森回复m0_63007695 2024.01.25
  你输入的照片的路径是全英文的吗？
- m0_63007695回复大梦汤普森 2024.01.11
  老哥还能回下么，我这也是一检测就卡死不知道为什么
- 恐怖粘贴人回复m0_50218259 2023.05.09
  当初解决了能正常识别，但太久了忘了咋解决的。
- m0_50218259回复恐怖粘贴人 2023.05.06
  你好，我也是同样的问题，请问是怎么解决的
- lucky rainbow2024回复恐怖粘贴人 2023.04.29
  您好这个只能在window下跑吗为什么我PyQt下载成功了，但 import PyQt5.QtCore ModuleNotFoundError: No module named 'PyQt5.QtCore'这个错误呢？
- qq_52610866回复恐怖粘贴人 2023.04.15
  你的这个问题解决了吗
- 大梦汤普森回复恐怖粘贴人 2023.04.15
  照片得要全英路径