ComfyUI字幕增强插件安装配置指南
ComfyUI_SLK_joy_caption_two是一个基于ComfyUI的字幕处理插件,它实现了JoyCaptionAlpha Two的功能,支持批量字幕处理和多种模型切换。
准备工作
在开始安装前,请确保您的系统满足以下要求:
- Python 3.7或更高版本
- Git工具已安装
- ComfyUI基础环境就绪
安装步骤
第一步:获取项目文件
将项目克隆到您的custom_nodes目录:
cd custom_nodes
git clone https://gitcode.com/gh_mirrors/co/ComfyUI_SLK_joy_caption_two.git
第二步:安装依赖包
进入项目目录并安装必要的依赖:
pip install -r ComfyUI_SLK_joy_caption_two/requirements.txt
依赖包包括:
- huggingface-hub>=0.23.4
- transformers>=4.44.0
- numpy==1.26.4
- sentencepiece==0.2.0
- pillow>=10.4.0
- bitsandbytes>=0.44.1
- peft>=0.12.0
第三步:下载核心模型
根据项目需求下载以下模型并放置到指定位置:
1. google/siglip-so400m-patch14-384模型 将模型文件复制到 models/clip/siglip-so400m-patch14-384 目录下。
2. Llama3.1-8B-Instruct模型 支持两个版本:
- bnb-4bit版本(适合小显存用户)
- 原版模型(需要更多显存资源)
将下载的模型文件复制到对应的 models/LLM/ 子目录中。
3. Joy-Caption-alpha-two模型(必须手动下载) 下载模型文件夹的所有内容并复制到 models/Joy_caption_two 目录下。
第四步:重启验证
完成上述步骤后,重启ComfyUI服务。您现在可以在节点列表中找到新的字幕处理功能。
功能特性
该插件提供了多种字幕处理模式:
- 描述性字幕(正式语气)
- 描述性字幕(非正式语气)
- 训练提示词生成
- MidJourney提示词
- Booru标签列表
- 艺术评论分析
- 产品列表描述
- 社交媒体帖子
批量处理功能
插件支持高级批量字幕处理,包括:
- 批量添加前缀字幕
- 批量添加后缀字幕
- 重命名开关控制
- 支持RGBA透明通道图片处理
可选汉化配置
如果您安装了AIGODLIKE翻译插件,可以添加中文支持:
cp translation/zh-CN/Nodes/Comfyui_SLK_joy_caption_two.json AIGODLIKE-ComfyUI-Translation/zh-CN/Nodes/
使用建议
- 首次使用时建议从简单配置开始测试
- 确保所有模型文件版本符合要求
- 8G显存环境推荐使用bnb-4bit版本模型
- 遇到问题时可以查看项目文档获取帮助
通过以上步骤,您就能成功安装这个功能强大的ComfyUI字幕增强插件,开始高效的字幕批量处理工作。
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考








