yolov8模型剪枝

最新推荐文章于 2025-08-10 17:40:58 发布

原创最新推荐文章于 2025-08-10 17:40:58 发布 · 5k 阅读

150 ·

CC 4.0 BY-SA版权

文章标签：

#YOLO #剪枝 #人工智能

部署运行你感兴趣的模型镜像

目录

一、约束训练（constrained training）

二、剪枝

三：回调训练

本文在官方yolov8.2的基础上进行剪枝。yolov8官网链接：ultralytics/ultralytics: NEW - YOLOv8 🚀 in PyTorch > ONNX > OpenVINO > CoreML > TFLite (github.com)https://github.com/ultralytics/ultralytics

本文的代码已上传GitHub，链接：yolov8_prune

GitHub - jasonDasuantou/yolov8_prune: This project demonstrates a systematic approach to model optimization, showcasing the importance of fine-tuning in the context of model pruning. It provides a foundation for further research and development in the field of efficient deep learning model deployment.This project demonstrates a systematic approach to model optimization, showcasing the importance of fine-tuning in the context of model pruning. It provides a foundation for further research and development in the field of efficient deep learning model deployment. - jasonDasuantou/yolov8_prunehttps://github.com/jasonDasuantou/yolov8_prune/tree/master

一、约束训练（constrained training）

1.理由

剪枝（Pruning）是一种神经网络压缩技术，它的目的是减少网络的复杂度，提高计算效率，同时尽量保持模型的性能。剪枝通常涉及移除网络中的一些权重或神经元，从而减少模型的大小和计算需求。然而，剪枝可能会对模型的泛化能力产生负面影响，因为移除的权重可能包含了对模型性能重要的信息。

为了缓解这个问题，约束化训练（Constrained Training）被引入。约束化训练是在训练过程中加入额外的约束来引导模型学习，以减少剪枝带来的负面影响。在BN（Batch Normalization）层添加L1正则化是一种常见的约束化训练方法。

L1正则化倾向于产生稀疏的权重矩阵，这意味着在训练后，模型的BN层权重矩阵中会有更多接近于零的值。在下一步剪枝的时候，就把这些有很多0值的矩阵去掉，这样处理后的模型对预测结果影响不大。

2.做法

a.在./ultralytics/engine/trainer.py中添加以下内容：

                # Backward
                self.scaler.scale(self.loss).backward()
 
                # ========== added（新增） ==========
                # 1 constrained training
                l1_lambda = 1e-2 * (1 - 0.9 * epoch / self.epochs)
                for k, m in self.model.named_modules():
                    if isinstance(m, nn.BatchNorm2d):
                        m.weight.grad.data.add_(l1_lambda * torch.sign(m.weight.data))
                        m.bias.grad.data.add_(1e-2 * torch.sign(m.bias.data))
                # ========== added（新增） ==========
 
                # Optimize - https://pytorch.org/docs/master/notes/amp_examples.html
                if ni - last_opt_step >= self.accumulate:
                    self.optimizer_step()
                    last_opt_step = ni

b.启动训练（/yolov8/train.py）：

import os
from ultralytics import YOLO
import torch
os.environ['KMP_DUPLICATE_LIB_OK'] = 'True'


def main():
    model = YOLO(r'ultralytics/cfg/models/v8/yolov8s.yaml').load('runs/detect/yolov8s/weights/best.pt')
    model.train(data="data.yaml", amp=False, imgsz=640, epochs=100, batch=20, device=0, workers=0)


if __name__ == '__main__':
    main()

二.剪枝

1.目的：结合L1或L0正则化来促进权重的稀疏性，然后剪除那些接近零的权重。

2.做法：在/yolov8/下新建文件prune.py，其中有三个参数：yolo加载的是约束训练后的模型；res_dir设置保存剪枝后的模型地址；fractor为剪枝率。具体内容如下：

from ultralytics import YOLO
import torch
from ultralytics.nn.modules import Bottleneck, Conv, C2f, SPPF, Detect
from copy import deepcopy

# Load a model
yolo = YOLO("./runs/detect/yolov8s/weights/last.pt")
# Save model address
res_dir = "./runs/detect/prune/weights/prune.pt"
# Pruning rate
factor = 0.75

yolo.info()
model = yolo.model
ws = []
bs = []

for name, m in model.named_modules():
    if isinstance(m, torch.nn.BatchNorm2d):
        w = m.weight.abs().detach()
        b = m.bias.abs().detach()
        ws.append(w)
        bs.append(b)
        # print(name, w.max().item(), w.min().item(), b.max().item(), b.min().item())

# keep

ws = torch.cat(ws)
threshold = torch.sort(ws, descending=True)[0][int(len(ws) * factor)]
print(threshold)


def prune_conv(conv1: Conv, conv2: Conv):
    gamma = conv1.bn.weight.data.detach()
    beta = conv1.bn.bias.data.detach()
    keep_idxs = []
    local_threshold = threshold
    while len(keep_idxs) < 8:
        keep_idxs = torch.where(gamma.abs() >= local_threshold)[0]
        local_threshold = local_threshold * 0.5
    n = len(keep_idxs)
    # n = max(int(len(idxs) * 0.8), p)
    # print(n / len(gamma) * 100)
    # scale = len(idxs) / n
    conv1.bn.weight.data = gamma[keep_idxs]
    conv1.bn.bias.data = beta[keep_idxs]
    conv1.bn.running_var.data = conv1.bn.running_var.data[keep_idxs]
    conv1.bn.running_mean.data = conv1.bn.running_mean.data[keep_idxs]
    conv1.bn.num_features = n
    conv1.conv.weight.data = conv1.conv.weight.data[keep_idxs]
    conv1.conv.out_channels = n

    if conv1.conv.bias is not None:
        conv1.conv.bias.data = conv1.conv.bias.data[keep_idxs]

    if not isinstance(conv2, list):
        conv2 = [conv2]

    for item in conv2:
        if item is not None:
            if isinstance(item, Conv):
                conv = item.conv
            else:
                conv = item
            conv.in_channels = n
            conv.weight.data = conv.weight.data[:, keep_idxs]


def prune(m1, m2):
    if isinstance(m1, C2f):  # C2f as a top conv
        m1 = m1.cv2

    if not isinstance(m2, list):  # m2 is just one module
        m2 = [m2]

    for i, item in enumerate(m2):
        if isinstance(item, C2f) or isinstance(item, SPPF):
            m2[i] = item.cv1

    prune_conv(m1, m2)


for name, m in model.named_modules():
    if isinstance(m, Bottleneck):
        prune_conv(m.cv1, m.cv2)

seq = model.model
for i in range(3, 9):
    if i in [6, 4, 9]: continue
    prune(seq[i], seq[i + 1])

detect: Detect = seq[-1]
last_inputs = [seq[15], seq[18], seq[21]]
colasts = [seq[16], seq[19], None]
for last_input, colast, cv2, cv3 in zip(last_inputs, colasts, detect.cv2, detect.cv3):
    prune(last_input, [colast, cv2[0], cv3[0]])
    prune(cv2[0], cv2[1])
    prune(cv2[1], cv2[2])
    prune(cv3[0], cv3[1])
    prune(cv3[1], cv3[2])

for name, p in yolo.model.named_parameters():
    p.requires_grad = True

#yolo.val(workers=0)  # 剪枝模型进行验证 yolo.val(workers=0)
yolo.info()
# yolo.export(format="onnx")  # 导出为onnx文件
# yolo.train(data="./data/data_nc5/data_nc5.yaml", epochs=100)  # 剪枝后直接训练微调
ckpt = {
            'epoch': -1,
            'best_fitness': None,
            'model': yolo.ckpt['ema'],
            'ema': None,
            'updates': None,
            'optimizer': None,
            'train_args': yolo.ckpt["train_args"],  # save as dict
            'date': None,
            'version': '8.0.142'}

torch.save(ckpt, res_dir)

最后为了保存的模型占用内存更小，重写了一下ckpt。

三：回调训练

1.目的：剪枝可能会暂时降低模型的性能，因为一些有用的权重被移除。回调训练可以帮助模型调整剩余的权重，以补偿被剪枝掉的权重，从而恢复或甚至提高模型的性能。

2.做法：

a.将先前在./ultralytics/engine/trainer.py中添加的L1正则化部分注释掉：

                # Backward
                self.scaler.scale(self.loss).backward()
 
                # # ========== added（新增） ==========
                # # 1 constrained training
                # l1_lambda = 1e-2 * (1 - 0.9 * epoch / self.epochs)
                # for k, m in self.model.named_modules():
                #     if isinstance(m, nn.BatchNorm2d):
                #         m.weight.grad.data.add_(l1_lambda * torch.sign(m.weight.data))
                #         m.bias.grad.data.add_(1e-2 * torch.sign(m.bias.data))
                # # ========== added（新增） ==========
 
                # Optimize - https://pytorch.org/docs/master/notes/amp_examples.html
                if ni - last_opt_step >= self.accumulate:
                    self.optimizer_step()
                    last_opt_step = ni

b.在./ultralytics/engine/trainer.py中的函数setup_model修改：

    def setup_model(self):
        """Load/create/download model for any task."""
        if isinstance(self.model, torch.nn.Module):  # if model is loaded beforehand. No setup needed
            return
 
        model, weights = self.model, None
        ckpt = None
        if str(model).endswith(".pt"):
            weights, ckpt = attempt_load_one_weight(model)
            cfg = weights.yaml
        else:
            cfg = model
        self.model = self.get_model(cfg=cfg, weights=weights, verbose=RANK == -1)  # calls Model(cfg, weights)
        # ========== added（新增） ==========
        # 2 finetune 回调训练
        self.model = weights
        # ========== added（新增） ==========
        return ckpt

c.我们再次启动训练（/yolov8/train.py）：

import os
from ultralytics import YOLO
import torch
os.environ['KMP_DUPLICATE_LIB_OK'] = 'True'


def main():
    model = YOLO('runs/detect/prune/weights/prune.pt')
    model.train(data="data.yaml", imgsz=640, epochs=100, batch=20, device=0, workers=0)


if __name__ == '__main__':
    main()

您可能感兴趣的与本文相关的镜像

Yolo-v5

Yolo

YOLO（You Only Look Once）是一种流行的物体检测和图像分割模型，由华盛顿大学的Joseph Redmon 和Ali Farhadi 开发。 YOLO 于2015 年推出，因其高速和高精度而广受欢迎

34 条评论

2301_77649133 2025.07.26
大佬，为什么用了剪枝之后保存的模型大小反而变大了，包括回调训练的模型也变大了
- 甲虫机回复2301_77649133 2025.12.15
  加一，请问解决了吗

TL_No1 2025.02.17
请问启动训练load的pt文件是哪个
- m0_73776030回复TL_No1 2025.02.26
  哥们你现在知道启动load的pt是哪一个了吗？我直接用yolov8s.pt按照我要的数据训练了一个best.pt作为启动训练的pt文件

weixin_55083979 2025.02.06
model': yolo.ckpt['ema'] 这是个none 这儿有问题，应该是"model"字段

weixin_55083979 2025.02.06
约束训练加载的模型是经过自定义数据训练过的模型还是原始模型

江木27 2025.01.22
博主你是否调试过代码我在v8中 # 2 finetune 回调训练 self.model = weights根本不会被执行这句话，所以我不理解加这句话的涵义，我想确定是版本问题还是这段代码不会生效

qq_52567631 2025.01.01
model = (ckpt.get('ema') or ckpt['model']).to(device).float() # FP32 model AttributeError: 'NoneType' object has no attribute 'to' 回调训练报错
- Zhm20030120回复数学人学python 2025.03.16
  剪枝那一块剪完只剩3kb了肯定不正常吧
- m0_73776030回复数学人学python 2025.02.26
  那应该怎么加载啊，使用的是作者您的git
- 数学人学python回复qq_52567631 2025.01.02
  模型没加载成功

sgy410324 2024.12.25
大佬请问剪枝那一步，yolo=YOLO里面使用best.pt和last.pt有什么区别？
- m0_64305226回复sgy410324 2025.01.06
  我和你一样，感觉可能是剪枝那块有点问题
- m0_64305226回复sgy410324 2025.01.06
  我也是只有3kb[face]emoji:010.png[/face]
- sgy410324回复数学人学python 2024.12.30
  我按照教程运行，跑出来的prune.pt只有3kb，试着用这个模型去运行的时候报错了，搜了一下，大概意思是prune.pt可能不包含有效的模型权重，能问问怎么解决吗？
- 数学人学python回复sgy410324 2024.12.27
  best里面存的是map最好的模型，last是训练结束的最后一个模型。best最好。

weixin_46063034 2024.12.09
大佬 yolov10的剪枝的话，检测头那部分是不是要重新写呀？
- 数学人学python回复weixin_46063034 2024.12.09
  有可能需要的。不过可以先试试看这个

莫夭阏之 2024.11.20
我在再次训练阶段遇到报错RuntimeError: element 0 of tensors does not require grad and does not have a grad_fn，说是在反向传播过程中，某些张量没有 requires_grad 属性设置为 True，因此无法计算梯度。不太明白在哪修改
- 数学人学python回复莫夭阏之 2024.12.27
  是从我git上clone的咩？我在原作者的基础上修改了，需要使用本文中的链接下载

莫夭阏之 2024.11.20
我生成的prune.pt怎么才2kb，这么小的吗
- 看我左手码代码回复sgy410324 2025.04.06
  换了什么代码呢可以请教一下吗
- 看我左手码代码回复sgy410324 2025.04.06
  后面解决了吗
- sgy410324回复TL_No1 2025.02.21
  没解决，换了其他代码
- TL_No1回复sgy410324 2025.02.19
  一样的问题，请问怎么解决
- 莫夭阏之回复sgy410324 2025.01.02
  解决不了，应该是代码有问题
- sgy410324回复莫夭阏之 2024.12.30
  请问你这个问题解决了吗？我这边3kb，YOLOv8 summary: 225 layers, 3012798 parameters, 0 gradients, 8.2 GFLOPs tensor(7.4506e-06) YOLOv8 summary: 225 layers, 2095238 parameters, 2095238 gradients, 7.1 GFLOPs 这个是运行的结果，模型用不了
- 数学人学python回复莫夭阏之 2024.12.27
  那肯定是有问题🤨

yolov8模型剪枝

目 录

一、约束训练（constrained training）

二、剪枝

三：回调训练

一、约束训练（constrained training）

1.理由

2.做法

a.在./ultralytics/engine/trainer.py中添加以下内容：

b.启动训练（/yolov8/train.py）：

二.剪枝

1.目的：结合L1或L0正则化来促进权重的稀疏性，然后剪除那些接近零的权重。

2.做法：在/yolov8/下新建文件prune.py，其中有三个参数：yolo加载的是约束训练后的模型；res_dir设置保存剪枝后的模型地址；fractor为剪枝率。具体内容如下：

三：回调训练

1.目的：剪枝可能会暂时降低模型的性能，因为一些有用的权重被移除。回调训练可以帮助模型调整剩余的权重，以补偿被剪枝掉的权重，从而恢复或甚至提高模型的性能。

2.做法：

a.将先前在./ultralytics/engine/trainer.py中添加的L1正则化部分注释掉：

b.在./ultralytics/engine/trainer.py中的函数setup_model修改：

c.我们再次启动训练（/yolov8/train.py）：

34 条评论

目录