sd-scripts图像标签工具:使用WD14 Tagger自动生成高质量描述
【免费下载链接】sd-scripts 项目地址: https://gitcode.com/gh_mirrors/sd/sd-scripts
想要为AI绘画训练准备高质量的图像标签吗?sd-scripts项目中的WD14 Tagger图像标签工具能够自动分析图片内容并生成准确的文字描述,大大提升训练数据的质量!✨
在stable diffusion模型训练过程中,准确详尽的图像标签是提升模型生成质量的关键因素。WD14 Tagger作为目前最先进的图像标签生成工具,相比传统的DeepDanbooru具有更高的准确率和更好的性能表现。
🚀 快速开始:一键安装与配置
首先克隆项目仓库:
git clone https://gitcode.com/gh_mirrors/sd/sd-scripts
然后安装必要的依赖:
pip install onnx==1.15.0 onnxruntime-gpu==1.17.1
📸 自动标签生成步骤
使用WD14 Tagger为你的训练图像生成标签非常简单:
python finetune/tag_images_by_wd14_tagger.py --onnx --repo_id SmilingWolf/wd-swinv2-tagger-v3 --batch_size 4 ../train_data
首次运行时,工具会自动从Hugging Face下载模型文件到wd14_tagger_model文件夹中。标签文件将创建在与训练图像相同的目录下,文件名相同但扩展名为.txt。
⚙️ 核心功能配置选项
基础设置
--batch_size: 批处理大小,根据VRAM容量调整--thresh: 标签置信度阈值,默认0.35--recursive: 递归处理子文件夹
标签优化
--remove_underscore: 移除标签中的下划线--undesired_tags: 指定不需要输出的标签--character_tags_first: 将角色标签放在最前面--always_first_tags: 指定始终放在首位的标签
🎯 高级使用技巧
动画风格优化配置
对于动画风格的图像,推荐使用以下配置:
python tag_images_by_wd14_tagger.py --onnx --repo_id SmilingWolf/wd-swinv2-tagger-v3 --batch_size 4 --remove_underscore --undesired_tags "PUT,YOUR,UNDESIRED,TAGS" --recursive --use_rating_tags_as_last_tag --character_tags_first --character_tag_expand --always_first_tags "1girl,1boy" ../train_data
模型选择指南
项目支持多种WD14 Tagger模型:
SmilingWolf/wd-swinv2-tagger-v3(推荐)SmilingWolf/wd-vit-tagger-v3SmilingWolf/wd-v1-4-convnext-tagger-v2(默认)
📊 标签分类详解
WD14 Tagger生成的标签分为三个主要类别:
🎭 角色标签 - 识别图像中的角色信息 🏷️ 通用标签 - 描述场景、服装、表情等 ⭐ 评级标签 - 图像质量评估
🔧 性能优化建议
- 使用ONNX推理模式以获得更好的性能
- 根据GPU内存调整批处理大小
- 启用DataLoader以加速图像加载
💡 实用场景应用
批量处理训练数据集
当你拥有大量训练图像时,WD14 Tagger可以一次性处理整个文件夹,大大节省手动标注的时间。
标签质量控制
通过调整置信度阈值,可以在标签数量和准确性之间找到最佳平衡点。较低的阈值会生成更多标签但准确性可能下降。
🛠️ 故障排除指南
如果遇到模型下载问题,可以使用--force_download选项强制重新下载。对于推理错误,建议检查ONNX运行时配置和GPU驱动兼容性。
使用sd-scripts中的WD14 Tagger图像标签工具,你可以在几分钟内为数百张图像生成高质量的标签描述,为AI绘画模型的训练提供强有力的数据支持!🌟
【免费下载链接】sd-scripts 项目地址: https://gitcode.com/gh_mirrors/sd/sd-scripts
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考



