YOLOv13改进策略【Backbone/轻量化】| PP-LCNet:轻量级的CPU卷积神经网络

一、本文介绍

本文记录的是利用PP-LCNet中的DepSepConv模块优化YOLOv13。本文利用DepSepConv模块改善模型结构,使模型在几乎不增加延迟的情况下提升网络准确度。


专栏目录:YOLOv13改进目录一览 | 涉及卷积层、轻量化、注意力、损失函数、Backbone、SPPF、Neck、检测头等全方位改进

专栏地址:YOLOv13改进专栏——以发表论文的角度,快速准确的找到有效涨点的创新点!


二、PP-LCNet介绍

PP-LCNet:一个轻量级的CPU卷积神经网络

2.1 PP-LCNet结构设计

2.1.1 特点

论文中总结了一系列在不增加推理时间的情况下提高精度的方法,并结合这些方法实现了精度和速度的更好平衡。基于此提出了设计轻量级CNN的一些通用规则。

2.1.2 模块原理

  • 基本块:使用MobileNetV1中提到的DepthSepConv作为基本块,该模块不会增加模型的推理速度和额外的操作,且已被英特尔CPU加速库深度优化,推理速度可超越其他轻量级块。

  • 激活函数:将BaseNet中的激活函数从ReLU替换为H-Swish,大大提高了性能,同时推理时间几乎不变。

  • SE模块SE模块有助于对网络通道进行加权以获得更好的特征,但在英特尔CPU上会增加推理时间。通过实验发现,将SE模块添加到网络尾部附近的块中,可以发挥更好的作用,实现更好的精度 - 速度平衡。

  • 卷积核大小:实验发现,在网络尾

Global: debug: false use_gpu: true epoch_num: 50 log_smooth_window: 20 print_batch_step: 10 save_model_dir: ./output/rec_ppocr_v4 save_epoch_step: 10 eval_batch_step: - 0 - 2000 cal_metric_during_train: true pretrained_model: D:\AI图片快速朔源\paddleOCR\PaddleOCR-release-2.8\pretrain_modles\en_PP-OCRv4_rec_train\best_accuracy.pdparams ignore_weights: ["Head.fc.weight", "Head.fc.bias"] checkpoints: null save_inference_dir: null use_visualdl: false infer_img: D:\AI图片快速朔源\paddleOCR\PaddleOCR-release-2.8\train_data\rec\train\20250311160809.jpg character_dict_path: ppocr/utils/en_dict.txt max_text_length: 30 infer_mode: false use_space_char: false distributed: false save_res_path: ./output/rec/predicts_ppocrv3.txt Optimizer: name: Adam beta1: 0.9 beta2: 0.999 lr: name: Cosine learning_rate: 0.0005 warmup_epoch: 5 regularizer: name: L2 factor: 3.0e-05 Architecture: model_type: rec algorithm: SVTR_LCNet Transform: null Backbone: name: PPLCNetV3 scale: 0.95 Head: name: CTCHead num_classes: 39 Neck: name: svtr dims: 480 depth: 2 hidden_dims: 480 kernel_size: - 1 - 3 use_guide: true Head: fc_decay: 1.0e-05 Loss: name: CTCLoss PostProcess: name: CTCLabelDecode Metric: name: RecMetric main_indicator: acc ignore_space: false Train: dataset: name: SimpleDataSet data_dir: D:\AI图片快速朔源\paddleOCR\PaddleOCR-release-2.8 label_file_list: - D:\AI图片快速朔源\paddleOCR\PaddleOCR-release-2.8\train_data\rec\train.txt transforms: - DecodeImage: img_mode: BGR channel_first: false - RecResizeImg: image_shape: [3, 48, 320] padding: true - KeepKeys: keep_keys: - image - label loader: shuffle: true batch_size_per_card: 96 drop_last: true num_workers: 8 Eval: dataset: name: SimpleDataSet data_dir: D:\AI图片快速朔源\paddleOCR\Pad
03-25
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Limiiiing

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值