【stable diffusion】图片批量自动打标签、标签批量修改(BLIP、wd14)用于训练SD或者LORA模型

该文介绍了使用B站教学视频中的方法进行AI绘画的Lora训练,包括BLIP和Deepbooru打标模型的比较,以及使用sd-webui插件进行自动打标和编辑标签的过程。此外,还提及了稳定扩散模型的GUI环境安装和模型微调所需的技术栈如CUDA、PyTorch和Xformer。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

参考:

2025.02.20最新教程——【FLUX微调+风格训练】从零免费训练自定义图像风格

一、sd-webui通用的打标界面

1.1 打标界面
根据需求,选择通用打标模型(BLIP)还是动漫打标模型(deepbooru)
设置好后,选择预处理,会开始下载模型,可开代理加速
在这里插入图片描述
1.2 BLIP打标结果
在这里插入图片描述

1.3 Deepbooru标注结果 (标签效果比下一段介绍的wd-14差一些)
在这里插入图片描述

二、sd-webui插件下wd14自动对动漫打标

插件名称: stable-diffusion-webui-wd14-tagger

安装与下载方式

可参考

stable-diffusion-webui 扩展模块安装

在 extensions/文件夹下拉取源码

git clone https://github.com/toriato/stable-diffusion-webui-wd14-tagger.git extensions/tagger

2.1 选择Tagger下的Batch from directory

在这里插入图片描述

2.2 输入图片的路径

图片与服务器应在同一台电脑

批量打标

在这里插入图片描述

单张图片看效果

可以了解到一些打标签原理,他是一个多类分类器,输出得每个词都是有概率的,一般输出置信度40%以上的词。
在这里插入图片描述

2.3 等待模型自动下载(可能卡住)

在这里插入图片描述

2.4 打标结果

在这里插入图片描述

图片与对应tag结果1
在这里插入图片描述

图片与对应tag结果2

在这里插入图片描述

三、sd-webui编辑标签

https://github.com/toshiaki1729/stable-diffusion-webui-dataset-tag-editor
下载:
在这里插入图片描述

3.1 导入自动打标后的图片

在这里插入图片描述

3.2 批量修改添加

首先在所有tag前面加一个风格tag: cike567
在这里插入图片描述

打开txt查看

在这里插入图片描述

3.3 批量删除

在这里插入图片描述

四、lora训练集成开发工具自动打标

dreambooth、lora、sd模型微调的GUI环境安装(cuda驱动、pytorch、xformer)

(下载模型时间长,过程是类似的,本文暂不介绍了)
在这里插入图片描述

4.1 BLIP打标

首先会下载模型,下载非常慢
在这里插入图片描述

扩展——方法 阿里线上平台打标

https://modelscope.cn/aigc/modelTraining
在这里插入图片描述

上传图片后选择 打标方式

在这里插入图片描述

通义千问 单词打标

在这里插入图片描述
翻译
在这里插入图片描述

joycaption是连续的句子,适合flux之类的

在这里插入图片描述

详情
在这里插入图片描述

### Stable Diffusion Tagger 插件及相关工具 Stable Diffusion 是一种基于深度学习的图像生成模型,能够通过文本描述生成高质量的图片。为了提高生成效果以及更好地管理训练数据集中的标签,社区开发了许多用于标记和分类图像的插件或工具。 #### 1. **Automatic1111 Web UI 的 Tagger 扩展** Automatic1111 提供了一个流行的 Stable Diffusion Web 用户界面扩展程序,其中包含一个名为 `Batch Image Tagging` 的功能模块[^3]。此模块允许用户批量处理图像并为其分配合适的标签。它支持多种预定义的标签集合,并可以自定义新的类别以便更精确地标记特定的数据子集。 #### 2. **DeepDanbooru** DeepDanbooru 是一款专门设计用来自动注二次元风格艺术作品的应用程序[^4]。它可以识别数以千计的不同属性(例如角色姿势、服装细节等),并将这些信息转换成适合输入给 Stable Diffusion 的格式。由于其强大的泛化能力,即使面对从未见过的新样式也能提供较为准确的结果。 #### 3. **Waifu-Diffusion 和其他定制框架** Waifu-Diffusion 及类似的项目通常会集成额外的功能来增强用户体验,其中包括改进版的 tagger 工具[^5]。这类解决方案往往针对特定领域进行了优化调整,比如动漫人物绘制或者游戏美术资源创建等领域内的应用需求。 以下是实现基本图像打的 Python 脚本示例: ```python import os from PIL import Image from torchvision.transforms.functional import to_tensor def load_image(image_path): img = Image.open(image_path).convert('RGB') tensor_img = to_tensor(img) return tensor_img.unsqueeze(0) # Example usage of loading an image file into memory as a PyTorch Tensor. image_file = 'example.jpg' loaded_image = load_image(os.path.join('.', image_file)) print(f'Image loaded successfully! Shape: {loaded_image.shape}') ``` 上述脚本展示了如何加载单张图片到内存中作为PyTorch张量对象的形式存在,这是许多现代机器学习工作流的第一步操作之一,在实际部署过程中可能还需要加入更多复杂的前处理步骤才能满足具体算法的要求。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

曾小蛙

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值