[PaddleDetection保姆级教程]使用自定义数据集实现吸烟识别预测

PaddleDetection

介绍

PaddleDetection是基于PaddlePaddle的端到端对象检测开发工具包,旨在帮助开发人员在训练模型的整个开发,优化性能和推理速度以及部署模型方面提供帮助。PaddleDetection在模块化设计中提供了各种对象检测体系结构,并提供了丰富的数据增强方法,网络组件,丢失功能等。PaddleDetection支持实际项目,例如工业质量检查,遥感图像对象检测以及具有模型等实际功能的自动检查。压缩和多平台部署。

现在,PaddleDetection中的所有模型都需要1.8版或更高版本的PaddlePaddle或合适的开发版本。

github地址:https://github.com/PaddlePaddle/PaddleDetection

项目地址:[PaddleDetection保姆级教程]使用自定义数据集实现吸烟识别预测

特征

丰富的型号:
PaddleDetection提供了丰富的模型,包括100多种预先训练的模型,例如对象检测,实例分割,面部检测等。它涵盖了冠军模型,适用于云和边缘设备的实用检测模型。

生产就绪:
关键操作在C ++和CUDA中实现,再加上PaddlePaddle的高效推理引擎,可以在服务器环境中轻松部署。

高度灵活:
组件设计为模块化。通过简单的配置更改即可轻松定制模型体系结构以及数据预处理管道。

性能优化:
借助基础的PaddlePaddle框架,可以加快培训速度并减少GPU内存占用。值得注意的是,与其他框架相比,YOLOv3培训要快得多。另一个示例是Mask-RCNN(ResNet50),在多GPU训练期间,我们设法为每个GPU(Tesla V100 16GB)最多容纳4张图像。

本次项目实验步骤以及实验结果

本次实验通过使用PaddleDetection2.0中的YOLOv3(主干网络为mobilenetv3的轻量化模型),通过几行代码就能实现吸烟的目标检测,后期可部署用于监控在公共场合禁烟区等,mAP值达到88.51%

实验步骤

  1. 解压自定义的数据集;

  2. 下载安装PaddleDetection包;

  3. 自定义数据集划分;

  4. 选择模型(本次选择YOLO-v3)进行训练:训练的配置文件说明;

5.效果可视化:使用训练好的模型进行预测,同时对结果进行可视化;

6.模型评估和预测:评估模型效果;

7.预测结果

实验结果

检测效果如下图所示:


1解压自定义的数据集

将把完成好标注的吸烟图片(VOC数据集)进行解压。

建议把上传压缩包

文件格式:

pp_somke:

–Annotations

  1.xml

  2.xml

  .......

–images:

  1.jpg

  2.jpg

  .......
!unzip -oq data/data94796/pp_smoke.zip -d work/

2下载安装PaddleDetection包

! git clone https://gitee.com/paddlepaddle/PaddleDetection.git
Cloning into 'PaddleDetection'...
remote: Enumerating objects: 14575, done.[K
remote: Counting objects: 100% (14575/14575), done.[K
remote: Compressing objects: 100% (6264/6264), done.[K
remote: Total 14575 (delta 10732), reused 11456 (delta 8175), pack-reused 0[K
Receiving objects: 100% (14575/14575), 132.71 MiB | 15.26 MiB/s, done.
Resolving deltas: 100% (10732/10732), done.
Checking connectivity... done.

3自定义数据集的划分

将数据集按照9:1的比例进行划分,并生成训练集train.txt和验证集val.txt进行训练

import random
import os
#生成train.txt和val.txt
random.seed(2020)
xml_dir  = '/home/aistudio/work/Annotations'#标签文件地址
img_dir = '/home/aistudio/work/images'#图像文件地址
path_list = list()
for img in os.listdir(img_dir):
    img_path = os.path.join(img_dir,img)
    xml_path = os.path.join(xml_dir,img.replace('jpg', 'xml'))
    path_list.append((img_path, xml_path))
random.shuffle(path_list)
ratio = 0.9
train_f = open('/home/aistudio/work/train.txt','w') #生成训练文件
val_f = open('/home/aistudio/work/val.txt' ,'w')#生成验证文件

for i ,content in enumerate(path_list):
    img, xml = content
    text = img + ' ' + xml + '\n'
    if i < len(path_list) * ratio:
        train_f.write(text)
    else:
        val_f.write(text)
train_f.close()
val_f.close()

#生成标签文档
label = ['smoke']#设置你想检测的类别
with open('/home/aistudio/work/label_list.txt', 'w') as f:
    for text in label:
        f.write(text+'\n')
%cd PaddleDetection
/home/aistudio/PaddleDetection

4 选择模型(本次选择YOLO-v3)进行训练:训练的配置文件说明

用户在选择好模型后,只需要改动对应的配置文件后,只需要运行train.py文件,即可实现训练。

本项目中,使用YOLOv3模型里的yolov3_mobilenet_v3_large_ssld_270e_voc.yml进行训练

4.1配置文件示例

我们使用configs/yolov3/yolov3_mobilenet_v3_large_ssld_270e_voc.yml配置进行训练。
在PaddleDetection2.0中,模块化做的更好,可以可自由修改覆盖各模块配置,进行自由组合。


配置文件结构说明

4.2配置文件详细说明

从上图看到yolov3_mobilenet_v3_large_ssld_270e_voc.yml配置需要依赖其他的配置文件。在该例子中需要依赖:

在修改文件之前,先给大家解释一下各依赖文件的作用:

  '../datasets/voc.yml'主要说明了训练数据和验证数据的路径,包括数据格式(coco、voc等)
  
  '../runtime.yml',主要说明了公共的运行状态,比如说是否使用GPU、迭代轮数等等  
  
  '_base_/optimizer_270e.yml',主要说明了学习率和优化器的配置,以及设置epochs。在其他的训练的配置中,学习率和优化器是放在了一个新的配置文件中。

   '_base_/yolov3_mobilenet_v3_large.yml',主要说明模型、和主干网络的情况说明

  '_base_/yolov3_reader.yml', 主要说明了读取后的预处理操作,比如resize、数据增强等等。

介绍一下需要修改的几个地方(画红线的地方):

…/datasets/voc.yml

base/optimizer_270e.yml


配置文件结构说明

4.3执行训练

执行下面命令快速进行训练,并开启vdl记录

!python tools/train.py -c configs/yolov3/yolov3_mobilenet_v3_large_ssld_270e_voc.yml --eval --use_vdl=True --vdl_log_dir="./output"

5.效果可视化:使用训练好的模型进行预测,同时对结果进行可视化

当打开use_vdl开关后,PaddleDetection会将训练过程中的数据写入VisualDL文件,可实时查看训练过程中的日志。记录的数据包括:

  1. loss变化趋势
  2. mAP变化趋势

使用如下命令启动VisualDL查看日志

# 下述命令会在127.0.0.1上启动一个服务,支持通过前端web页面查看,可以通过--host这个参数指定实际ip地址
visualdl --logdir output/

在浏览器输入提示的网址,效果如下:

visualdl --logdir output/
  File "<ipython-input-68-4b7c990a0c4d>", line 1
    visualdl --logdir output/
                           ^
SyntaxError: invalid syntax

如果上面代码执行不成功,可以通过左端界面控制进行查看

具体操作可以去查看这个网站:https://my.oschina.net/u/4067628/blog/4839747(第三步骤)


6.模型评估

python -u tools/eval.py -c configs/yolov3/yolov3_mobilenet_v3_large_ssld_270e_voc.yml \
-o weights=output/yolov3_mobilenet_v3_large_ssld_270e_voc/best_model.pdparams
!python -u tools/eval.py -c configs/yolov3/yolov3_mobilenet_v3_large_ssld_270e_voc.yml  -o weights=output/yolov3_mobilenet_v3_large_ssld_270e_voc/best_model.pdparams

7. 模型预测

在执行tools/infer.py后,在output文件夹下会生成对应的预测结果

python tools/infer.py -c configs/yolov3/yolov3_mobilenet_v3_large_ssld_270e_voc.yml \  
-o weights=output/yolov3_mobilenet_v3_large_ssld_270e_voc/best_model.pdparams \
--infer_img=dataset/113.jpg(需要检测的图片)
!python tools/infer.py -c configs/yolov3/yolov3_mobilenet_v3_large_ssld_270e_voc.yml -o weights=output/yolov3_mobilenet_v3_large_ssld_270e_voc/best_model.pdparams --infer_img=/home/aistudio/work/xiayan2.jpg
/opt/conda/envs/python35-paddle120-env/lib/python3.7/site-packages/paddle/tensor/creation.py:125: DeprecationWarning: `np.object` is a deprecated alias for the builtin `object`. To silence this warning, use `object` by itself. Doing this will not modify any behavior and is safe. 
Deprecated in NumPy 1.20; for more details and guidance: https://numpy.org/devdocs/release/1.20.0-notes.html#deprecations
  if data.dtype == np.object:
W0611 21:05:17.302584 21170 device_context.cc:404] Please NOTE: device: 0, GPU Compute Capability: 7.0, Driver API Version: 10.1, Runtime API Version: 10.1
W0611 21:05:17.307160 21170 device_context.cc:422] device: 0, cuDNN Version: 7.6.
[06/11 21:05:21] ppdet.utils.checkpoint INFO: Finish loading model weights: output/yolov3_mobilenet_v3_large_ssld_270e_voc/best_model.pdparams
[06/11 21:05:21] ppdet.engine INFO: Detection bbox results save in output/xiayan2.jpg

- 结果展示


原图



预测图


总结

由上图我们可以看到,使用PaddleDetection完成了吸烟的目标识别检测,并且mAP已经达到了88.51%

优化方案

可以通过增加数据集、选择更优化模型,增加训练的次数。

后期应用

可以把语音加到识别之后,如果识别到有人吸烟,则可播报语音,进行警告

后期可以部署到禁烟区公共场合监控中实现检测吸烟检测等项目。

具体可以去看PaddleDetection详细教程

https://paddledetection.readthedocs.io/tutorials/GETTING_STARTED_cn.html

关于作者

感兴趣的方向为:目标检测,分类任务等

AIstudio主页: 我在AI Studio上获得白银等级,点亮3个徽章,来互关呀~ 我在AI Studio上获得黄金等级,点亮7个徽章,来互关呀~

https://aistudio.baidu.com/aistudio/personalcenter/thirdview/474269

Github主页: https://github.com/Niki173

欢迎大家有问题留言交流学习,共同进步成长。

<think>好的,我现在需要帮用户查找PaddleDetection使用教程、安装配置和示例代码。首先,我应该看看用户提供的引用内容,看看有没有相关的信息。 根据引用[1],里面提到了安装PaddleDetection的方法一,使用pip安装。具体命令是pip install paddledet==2.1.0,并且要指定镜像源。还有通过git克隆仓库的步骤。这部分应该可以整理成安装步骤。另外,用户可能需要知道如何验证安装是否成功,但引用里没提到,可能需要补充注意事项。 引用[2]提到PaddleDetection的安装和配置指南,项目地址在GitCode。用户可能需要访问这个地址来获取源码,所以应该给出链接。同时,安装后的配置可能需要参考官方文档,但引用中没有详细说明,可能需要提醒用户查阅官方指南。 引用[3]主要介绍了模型技术细节和应用,包括如何搭建模型、定义检测组件和配置运行。这部分可能属于使用教程的一部分,特别是模型配置和训练部分。用户可能需要知道如何修改配置文件,运行训练脚本,这里可以结合引用中的内容进行说明。 引用[4]是一个保姆教程使用自定义数据集实现跌倒识别预测。这应该是一个具体的示例,用户可以按照这个教程学习如何使用PaddleDetection进行目标检测任务。需要提到这个教程的目的,以及如何帮助用户熟悉API和后续自己实现网络。 接下来,我需要将这些信息组织成结构清晰的步骤,分为安装配置、使用教程和示例代码三个部分。安装部分要详细说明两种方法:pip安装和源码安装。使用教程需要包含模型配置和训练流程。示例代码部分需要提供基本的目标检测代码和参考教程。 同时,用户可能需要进一步的问题,比如安装问题、数据集准备和模型导出部署,所以需要生成相关问题。另外,要确保所有数学公式或代码块符合格式要求,但这里可能不太涉及数学公式,主要是代码块需要用反引号包裹。 最后,检查引用是否正确标注,比如安装步骤部分引用[1][2],模型配置引用[3],示例代码引用[4]。确保没有遗漏关键步骤,如安装后的验证或环境准备。</think>### PaddleDetection 使用教程及安装配置指南 --- #### **一、安装配置** 1. **方法一:pip安装** ```bash pip install paddledet==2.1.0 -i https://mirror.baidu.com/pypi/simple ``` 安装完成后,下载源码中的配置文件和代码示例: ```bash git clone https://github.com/PaddlePaddle/PaddleDetection.git cd PaddleDetection ``` [^1][^2] 2. **方法二:源码安装(推荐)** 从官方镜像仓库获取最新代码: ```bash git clone https://gitcode.com/gh_mirrors/pa/PaddleDetection.git cd PaddleDetection pip install -r requirements.txt ``` [^2] **注意**:需预先安装Python3和PaddlePaddle框架,并配置CUDA环境(GPU用户需额外安装CUDA驱动)。 --- #### **二、使用教程** 1. **模型配置与训练** - PaddleDetection提供丰富的预训练模型(如Faster R-CNN、YOLO系列),配置文件位于`configs/`目录。 - 修改配置文件(如`configs/yolov3/yolov3_darknet53.yml`)以适配数据集路径和超参数。 - 启动训练: ```bash python tools/train.py -c configs/yolov3/yolov3_darknet53.yml ``` [^3] 2. **数据集准备** 支持COCO、VOC等格式。自定义数据集需转换为标准格式,并更新配置文件中`dataset_dir`和`anno_path`字段。 --- #### **三、示例代码** **目标检测预测示例**(需先下载预训练模型): ```python from paddledet.core.workspace import load_config from paddledet.engine import Trainer cfg = load_config('configs/yolov3/yolov3_darknet53.yml') trainer = Trainer(cfg, mode='test') trainer.load_weights('output/model_final.pdparams') results = trainer.predict([cv2.imread('test.jpg')]) # 输入需为图像数组 ``` [^3] **参考教程**: - [使用自定义数据集实现跌倒识别预测](https://aistudio.baidu.com/projectdetail/123456) [^4] 涵盖数据标注、模型训练、预测部署全流程,适合快速入门。 ---
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值