Python —— 解析Yolov5 - train.py、export.py

原创已于 2023-03-24 16:07:04 修改 · 5.5k 阅读

46 ·

CC 4.0 BY-SA版权

automoblie0

文章标签：

#python #YOLO #深度学习

于 2023-03-24 11:22:25 首次发布

Python 专栏收录该内容

15 篇文章

订阅专栏

本文详细介绍了在Windows10操作系统中配置Pytorch环境的过程，并解析了`train.py`和`export.py`两个关键脚本的参数，包括数据集路径、模型权重、训练轮数、优化器设置等，用于模型训练和转换。此外，还提到了不同的运行选项，如多GPU训练、超参数优化和模型导出格式。

部署运行你感兴趣的模型镜像

Python —— Windows10下配置Pytorch环境、进行训练模型并测试

train.py参数解析

1、运行train.py的两种方式：

(1)、使用命令：
python train.py --data data/voc-cs.yaml --cfg models/yolov5s-cs.yaml --weights weights/yolov5s.pt --batch-size 16 --epochs 50 --workers 2 --name base

(2)、在ide或无参命令运行detect.py文件
该方式将方式一的命令参数直接在train.py中修改后执行

2、参数解析

def parse_opt(known=False):
    parser = argparse.ArgumentParser()
    
    # 预训练模型权重文件路径
    parser.add_argument('--weights', type=str, default=ROOT / 'yolov5s.pt', help='initial weights path')
    
    # 模型配置文件路径（示例:models/yolov5s-cs.yaml）
    parser.add_argument('--cfg', type=str, default='', help='model.yaml path')
    
    # 训练数据集路径（示例:data/voc-cs.yaml）
    parser.add_argument('--data', type=str, default=ROOT / 'data/voc-cs.yaml', help='dataset.yaml path')
    
    # hyperparameter 超参数文件
    parser.add_argument('--hyp', type=str, default=ROOT / 'data/hyps/hyp.scratch-low.yaml', help='hyperparameters path')
    
    # 训练轮数。整个数据集将被迭代的次数,一轮即train.py文件在所有训练集上完成一次遍历
    parser.add_argument('--epochs', type=int, default=100, help='total training epochs')
    
    # 每次训练时一批数据中包含多少张图片
    parser.add_argument('--batch-size', type=int, default=16, help='total batch size for all GPUs, -1 for autobatch')
    
    # 输入图片大小。一组训练集图片可能有不同尺寸,而模型输入接收端口是固定的。因此正式训练前,图片需要先处理成统一的大小,一般处理成正方形,边长为imgsz
    parser.add_argument('--imgsz', '--img', '--img-size', type=int, default=640, help='train, val image size (pixels)')
    
    # 训练过程中是否进行图像矫正,例如--rect表示进行图像矫正
    parser.add_argument('--rect', action='store_true', help='rectangular training')
    
    # 是否从之前训练中断处继续训练,例如--resume表示从中断处继续训练
    parser.add_argument('--resume', nargs='?', const=True, default=False, help='resume most recent training')
    
    # 是否不保存模型,仅会保存最终的checkpoint
    parser.add_argument('--nosave', action='store_true', help='only save final checkpoint')
    
    # 正常每轮训练结束后都会验证,设为true则只进行最后一次验证
    parser.add_argument('--noval', action='store_true', help='only validate final epoch')
    
    # 不自动确定锚框
    parser.add_argument('--noautoanchor', action='store_true', help='disable AutoAnchor')
    
    # 不做图。模型会输出一些图片比如loss随epoch的变化（即收敛情况）,设为false则不输出图片。
    parser.add_argument('--noplots', action='store_true', help='save no plot files')
    
    # 否进行超参数优化
    parser.add_argument('--evolve', type=int, nargs='?', const=300, help='evolve hyperparameters for x generations')
    
    # 是否上传到云。gustil是谷歌云提供的python包,实现数据云上传存储处理等操作；bucket指数据的容器,或理解成cloud上的一个文件夹。
    parser.add_argument('--bucket', type=str, default='', help='gsutil bucket')
    
    # 缓存，选择缓存硬件。可以选择在ram或者在disk上进行缓存,默认直接在ram
    parser.add_argument('--cache', type=str, nargs='?', const='ram', help='image --cache ram/disk')
    
    # 是否采用图像权重进行选择训练。设为True时,计算图像采集的权重,若图像权重越大,那么该图像被采样的概率也越大
    parser.add_argument('--image-weights', action='store_true', help='use weighted image selection for training')
    
    # 运行代码的硬件。可指定cpu或者在某一编号的gpu上运行代码
    parser.add_argument('--device', default='', help='cuda device, i.e. 0 or 0,1,2,3 or cpu')
    
    # 是否多尺度训练图片。设为True时,将图片放缩成多个尺寸,能够得到不同尺度的特征信息,但速度慢。
    parser.add_argument('--multi-scale', action='store_true', help='vary img-size +/- 50%%')
    
    # 单类别训练。设为True时,把多类别标签都视为同一种标签进行训练
    parser.add_argument('--single-cls', action='store_true', help='train multi-class data as single-class')
    
    # 优化器。默认SGD,有3种可选择'SGD','Adam','AdamW'
    parser.add_argument('--optimizer', type=str, choices=['SGD', 'Adam', 'AdamW'], default='SGD', help='optimizer')
    
    # 同步批处理。使用多GPU进行分布式训练时,不同GPU训练batch需要同步。设为True则开启。
    parser.add_argument('--sync-bn', action='store_true', help='use SyncBatchNorm, only available in DDP mode')
    
    # 用于加载数据的进程数,例如--workers 8表示使用8个进程来加载数据
    parser.add_argument('--workers', type=int, default=8, help='max dataloader workers (per RANK in DDP mode)')
    
    # 运行项目。运行结果保存到文件夹总地址,如runs/train/或runs/detect
    parser.add_argument('--project', default=ROOT / 'runs/train', help='save to project/name')
    
    # 名称。即每次运行结果所保存文件夹名称,如设置为exp,不同次项目运行结果将保存到runs/train/exp1或exp2…,后缀会增加
    parser.add_argument('--name', default='exp', help='save to project/name')
    
    # 存在正常。不用对exp的数字后缀递增。即设为True,项目运行结果将保存到现有文件夹中,而不是新建一个exp文件夹
    parser.add_argument('--exist-ok', action='store_true', help='existing project/name ok, do not increment')
    
    # 是否使用四元数据加载器。一个实验性功能参数,允许小尺寸图片训练时获得高尺寸训练的优势
    parser.add_argument('--quad', action='store_true', help='quad dataloader')
    
    # 余弦学习率调度器。设为True时开启余弦学习率调度器
    parser.add_argument('--cos-lr', action='store_true', help='cosine LR scheduler')
    
    # 标签平滑。计算的loss有所变化,作用是防止过拟合,但数值过大会导致欠拟合
    parser.add_argument('--label-smoothing', type=float, default=0.0, help='Label smoothing epsilon')
    
    # 耐心值。训练提前停止的阈值轮数,若经过patience轮训练,效果一直没有提升,就提前停止训练
    parser.add_argument('--patience', type=int, default=100, help='EarlyStopping patience (epochs without improvement)')
    
    # 冻结。冻结网络的指定层,冻结的层的权重在训练过程中不会改变
    parser.add_argument('--freeze', nargs='+', type=int, default=[0], help='Freeze layers: backbone=10, first3=0 1 2')
    
    # 保存周期。每一定轮数保存一次checkpoint
    parser.add_argument('--save-period', type=int, default=-1, help='Save checkpoint every x epochs (disabled if < 1)')
    
    # 固定训练的随机性
    parser.add_argument('--seed', type=int, default=0, help='Global training seed')
    
    # 本地进程号。多GPU模型自动修改,不用手动修改。
    parser.add_argument('--local_rank', type=int, default=-1, help='Automatic DDP Multi-GPU argument, do not modify')

    # Logger arguments。[logger日志参数4个,不影响模型的运行效果]
    parser.add_argument('--entity', default=None, help='Entity')
    parser.add_argument('--upload_dataset', nargs='?', const=True, default=False, help='Upload data, "val" option')
    parser.add_argument('--bbox_interval', type=int, default=-1, help='Set bounding-box image logging interval')
    parser.add_argument('--artifact_alias', type=str, default='latest', help='Version of dataset artifact to use')

    return parser.parse_known_args()[0] if known else parser.parse_args()

export.py参数解析

使用命令：
python export.py

def parse_opt(known=False):
    parser = argparse.ArgumentParser()
    
    # 数据集目录。改为训练模型时yaml格式数据集路径即可
    parser.add_argument('--data', type=str, default=ROOT / 'data/voc-cs.yaml', help='dataset.yaml path')
    
    # 转换后的模型文件路径
    parser.add_argument('--weights', nargs='+', type=str, default=ROOT / 'runs/train/base/weights/best.pt', help='model.pt path(s)')
    
    # 输入模型的图片size
    parser.add_argument('--imgsz', '--img', '--img-size', nargs='+', type=int, default=[640, 640], help='image (h, w)')
    parser.add_argument('--batch-size', type=int, default=1, help='batch size')
    
    # 模型运行设备:使用cpu或某gpu运行
    parser.add_argument('--device', default='0', help='cuda device, i.e. 0 or 0,1,2,3 or cpu')
    
    # 是否使用半精度FP16export转换 默认=False
    parser.add_argument('--half', action='store_true', help='FP16 half-precision export')
    
    # 是否设置YOLOv5 Detect()
    parser.add_argument('--inplace', action='store_true', help='set YOLOv5 Detect() inplace=True')
    parser.add_argument('--keras', action='store_true', help='TF: use Keras')
    
    # TorchScript转化参数,是否进行移动端优化
    parser.add_argument('--optimize', action='store_true', help='TorchScript: optimize for mobile')
    parser.add_argument('--int8', action='store_true', help='CoreML/TF INT8 quantization')
    
    # ONNX转换是否要进行批处理变量
    parser.add_argument('--dynamic', action='store_true', help='ONNX/TF/TensorRT: dynamic axes')
    
    # 是否简化onnx模型
    parser.add_argument('--simplify', action='store_true', help='ONNX: simplify model')
    #parser.add_argument('--opset', type=int, default=17, help='ONNX: opset version')
    parser.add_argument('--opset', type=int, default=12, help='ONNX: opset version')
    parser.add_argument('--verbose', action='store_true', help='TensorRT: verbose log')
    parser.add_argument('--workspace', type=int, default=4, help='TensorRT: workspace size (GB)')
    parser.add_argument('--nms', action='store_true', help='TF: add NMS to model')
    parser.add_argument('--agnostic-nms', action='store_true', help='TF: add agnostic NMS to model')
    parser.add_argument('--topk-per-class', type=int, default=100, help='TF.js NMS: topk per class to keep')
    parser.add_argument('--topk-all', type=int, default=100, help='TF.js NMS: topk for all classes to keep')
    parser.add_argument('--iou-thres', type=float, default=0.45, help='TF.js NMS: IoU threshold')
    parser.add_argument('--conf-thres', type=float, default=0.25, help='TF.js NMS: confidence threshold')
    
    # 要将pt文件转为什么格式模型
    parser.add_argument(
        '--include',
        nargs='+',
        default=['onnx'],
        help='torchscript, onnx, openvino, engine, coreml, saved_model, pb, tflite, edgetpu, tfjs, paddle')
    opt = parser.parse_known_args()[0] if known else parser.parse_args()
    print_args(vars(opt))
    return opt