PaddleSeg API使用教程：从模型训练到预测全流程解析

祖筱泳

于 2025-06-04 09:20:01 发布

阅读量340

点赞数 4

CC 4.0 BY-SA版权

本文链接：https://blog.youkuaiyun.com/gitblog_01111/article/details/148419245

PaddleSeg API使用教程：从模型训练到预测全流程解析

PaddleSeg Easy-to-use image segmentation library with awesome pre-trained model zoo, supporting wide-range of practical tasks in Semantic Segmentation, Interactive Segmentation, Panoptic Segmentation, Image Matting, 3D Segmentation, etc. 项目地址: https://gitcode.com/gh_mirrors/pa/PaddleSeg

前言

语义分割是计算机视觉领域的重要任务，广泛应用于自动驾驶、医疗影像分析、遥感图像处理等场景。PaddleSeg作为飞桨生态中的图像分割开发套件，提供了丰富的API接口，让开发者能够快速实现从模型训练到预测的全流程。本文将详细介绍如何使用PaddleSeg API完成语义分割任务。

环境准备

在开始之前，我们需要确保已经安装了PaddleSeg。可以通过以下命令快速安装：

!pip install paddleseg

安装完成后，我们就可以开始构建语义分割模型了。

模型训练全流程

1. 模型构建

PaddleSeg提供了多种预置的语义分割模型，这里我们以BiSeNetV2为例：

from paddleseg.models import BiSeNetV2
model = BiSeNetV2(
    num_classes=2,          # 类别数
    lambd=0.25,            # 控制模型大小的参数
    align_corners=False,   # 是否对齐角点
    pretrained=None        # 预训练模型路径
)

BiSeNetV2是一种轻量级实时语义分割网络，通过双路结构实现了精度和速度的良好平衡，非常适合边缘设备部署。

2. 数据准备与增强

训练集构建

from paddleseg.datasets import OpticDiscSeg
import paddleseg.transforms as T

# 定义数据增强策略
transforms = [
    T.Resize(target_size=(512, 512)),  # 调整图像大小
    T.RandomHorizontalFlip(),          # 随机水平翻转
    T.Normalize()                      # 归一化处理
]

# 创建训练数据集
train_dataset = OpticDiscSeg(
    dataset_root='data/optic_disc_seg',
    transforms=transforms,
    mode='train'
)

验证集构建

# 验证集不需要数据增强，只需基础预处理
val_transforms = [
    T.Resize(target_size=(512, 512)),
    T.Normalize()
]

val_dataset = OpticDiscSeg(
    dataset_root='data/optic_disc_seg',
    transforms=val_transforms,
    mode='val'
)

PaddleSeg提供了多种数据增强方法，合理使用可以显著提升模型泛化能力。

3. 优化器配置

import paddle

# 使用多项式衰减学习率
base_lr = 0.01
lr = paddle.optimizer.lr.PolynomialDecay(
    base_lr, 
    power=0.9, 
    decay_steps=1000, 
    end_lr=0
)

# 使用Momentum优化器
optimizer = paddle.optimizer.Momentum(
    lr, 
    parameters=model.parameters(), 
    momentum=0.9, 
    weight_decay=4.0e-5
)

学习率策略对模型训练至关重要，多项式衰减可以在训练初期使用较大学习率快速收敛，后期使用较小学习率精细调整。

4. 损失函数配置

BiSeNetV2采用多路监督训练，需要为每个输出分支配置损失函数：

from paddleseg.models.losses import CrossEntropyLoss

losses = {
    'types': [CrossEntropyLoss()] * 5,  # 5个输出分支都使用交叉熵损失
    'coef': [1] * 5                     # 每个分支的损失权重
}

多路监督可以缓解深度网络训练中的梯度消失问题，提升模型性能。

5. 启动训练

from paddleseg.core import train

train(
    model=model,
    train_dataset=train_dataset,
    val_dataset=val_dataset,
    optimizer=optimizer,
    save_dir='output',      # 模型保存路径
    iters=1000,            # 训练迭代次数
    batch_size=4,          # 批大小
    save_interval=200,     # 保存间隔
    log_iters=10,          # 日志打印间隔
    num_workers=0,         # 数据加载线程数
    losses=losses,         # 损失函数配置
    use_vdl=True           # 是否使用VisualDL记录训练过程
)

训练过程中，模型会定期在验证集上评估，并保存性能最好的模型参数。

模型评估方法

训练完成后，我们需要评估模型在测试集上的表现。

1. 加载训练好的模型

model_path = 'output/best_model/model.pdparams'
if model_path:
    para_state_dict = paddle.load(model_path)
    model.set_dict(para_state_dict)
    print('模型参数加载成功')

2. 基础评估

from paddleseg.core import evaluate

evaluate(
    model,
    val_dataset
)

3. 多尺度+翻转评估

为了更全面评估模型性能，可以使用多尺度和翻转增强：

evaluate(
    model,
    val_dataset,
    aug_eval=True,                  # 开启增强评估
    scales=[0.75, 1.0, 1.25],      # 多尺度评估
    flip_horizontal=True            # 水平翻转增强
)

多尺度评估可以测试模型对不同大小目标的识别能力，是学术论文中常用的评估策略。

预测与可视化

训练好的模型可以用于对新图像进行预测和可视化。

1. 准备预测图像

import os

def get_image_list(image_path):
    """获取图像列表"""
    valid_suffix = ['.JPEG', '.jpeg', '.JPG', '.jpg', '.BMP', '.bmp', '.PNG', '.png']
    image_list = []
    
    if os.path.isfile(image_path):
        if os.path.splitext(image_path)[-1] in valid_suffix:
            image_list.append(image_path)
    elif os.path.isdir(image_path):
        for root, _, files in os.walk(image_path):
            for f in files:
                if os.path.splitext(f)[-1] in valid_suffix:
                    image_list.append(os.path.join(root, f))
    else:
        raise FileNotFoundError('输入路径不存在或格式不正确')
    
    return image_list, os.path.dirname(image_path) if os.path.isfile(image_path) else image_path

image_list, image_dir = get_image_list('data/optic_disc_seg/JPEGImages/N0010.jpg')

2. 执行预测

from paddleseg.core import predict

predict(
    model,
    model_path='output/best_model/model.pdparams',
    transforms=transforms,
    image_list=image_list,
    image_dir=image_dir,
    save_dir='output/results'  # 结果保存目录
)

预测结果会保存在指定目录下，包含两种可视化形式：