基于文本提示和语义分割的快速抠图

OverlordDuke

已于 2024-02-26 11:06:18 修改

阅读量770

点赞数 11

CC 4.0 BY-SA版权

分类专栏：深度学习语义分割文章标签：语义分割人工智能计算机视觉

于 2024-02-26 10:29:18 首次发布

本文链接：https://blog.youkuaiyun.com/qq_36315683/article/details/136293411

深度学习同时被 2 个专栏收录

44 篇文章

订阅专栏

语义分割

1 篇文章

订阅专栏

本文介绍了如何利用PaddleHub中的基于文本提示的语义分割模型进行快速、灵活的图像抠图，包括模型安装、命令行和代码调用方法，以及效果展示和参考资料。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

基于文本提示和语义分割的快速抠图

1. 介绍

传统的图像语义分割模型通常固定类别进行分割，而基于文本提示的语义分割模型则具有更高的灵活性。本文介绍的模型允许用户通过输入文本标签来手动控制分割的类别信息，从而实现快速抠图的需求。

2. 效果展示

通过控制文本标签，模型能够快速、精准地抠出特定物体，以下是部分抠图效果展示：

在这里插入图片描述

3. 安装模型

使用 PaddleHub 可以便捷地安装该语义分割模型：

!pip install --upgrade paddlenlp
!hub install lseg

4. 命令行调用

通过简单的命令行指令即可快速调用模型进行抠图：

!hub run lseg \
    --input_path "images/cat.jpeg" \
    --labels 'cat' 'other' \
    --output_dir "lseg_output"

文本标签支持中英文，模型会自动翻译至英文输入。

5. 代码调用

5.1 模型加载

import paddlehub as hub

module = hub.Module(name="lseg")

5.2 可视化函数定义

import cv2
import numpy as np
from PIL import Image

def vis(results):
    result = np.concatenate([
        results['color'], 
        results['mix']
    ], 1)
    return Image.fromarray(result[:, :, ::-1])

5.3 图像语义分割

# 定义图像路径 / 类别 / 保存路径
image_path = 'images/cat.jpeg'
labels = ['plant', 'grass', 'cat', 'stone', 'other']
output_dir = 'lseg_output'

# 图像分割
results = module.segment(
    image=image_path,
    labels=labels,
    visualization=True,
    output_dir=output_dir
)

# 可视化
vis(results)

或者直接使用 numpy.ndarray BGR 格式的图像：

# 定义图像路径 / 类别 / 保存路径
image_path = 'images/cat.jpeg'
labels = ['plant', 'grass', 'cat', 'stone', 'other']
output_dir = 'lseg_output'

# 图像分割
results = module.segment(
    image=cv2.imread(image_path),
    labels=labels,
    visualization=True,
    output_dir=output_dir
)

# 可视化
vis(results)