ComfyUI字幕处理插件安装配置指南
ComfyUI_SLK_joy_caption_two是一个基于ComfyUI的字幕处理插件,实现了JoyCaptionAlpha Two的功能,支持批量添加前缀和后缀字幕,以及多种模型的加载和切换。
环境要求
在开始安装前,请确保系统满足以下要求:
- Python 3.7或更高版本
- Git工具已安装
- ComfyUI基础环境就绪
安装步骤
第一步:获取插件源码
进入custom_nodes目录,执行以下命令:
cd custom_nodes
git clone https://gitcode.com/gh_mirrors/co/ComfyUI_SLK_joy_caption_two.git
第二步:安装依赖包
pip install -r ComfyUI_SLK_joy_caption_two/requirements.txt
依赖包包括huggingface-hub、transformers、numpy、sentencepiece、pillow、bitsandbytes和peft等。
模型配置
为了让插件正常工作,需要下载以下AI模型并放置到指定目录:
视觉模型配置
- SigLIP模型:将google/siglip-so400m-patch14-384下载后放置到models/clip/siglip-so400m-patch14-384目录下
语言模型配置
支持两种版本的Llama3.1-8B-Instruct模型:
4位量化版本(推荐8GB显存环境使用):
- 下载unsloth/Meta-Llama-3.1-8B-Instruct-bnb-4bit
- 将内容复制到models/LLM/Meta-Llama-3.1-8B-Instruct-bnb-4bit目录下
标准版本:
- 下载unsloth/Meta-Llama-3.1-8B-Instruct
- 将内容复制到models/LLM/Meta-Llama-3.1-8B-Instruct目录下
核心模型配置
- JoyCaption核心模型:必须手动下载Joy-Caption-alpha-two模型中的cgrkzexw-599808文件夹
- 将所有内容复制到models/Joy_caption_two目录下
启动与使用
完成上述步骤后,重启ComfyUI即可在节点列表中找到新增的字幕处理功能。
可选功能
中文界面支持
如果安装了AIGODLIKE语言包插件,可以复制中文翻译文件: 将translation/zh-CN/Nodes/Comfyui_SLK_joy_caption_two.json复制到AIGODLIKE-ComfyUI-Translation/zh-CN/Nodes目录下,重启后即可使用中文界面。
核心功能特性
- 批量字幕前缀和后缀添加
- 多种语言模型灵活切换
- 可视化节点操作界面
- 高效批量处理能力
- 支持低显存模式运行
插件提供了多个节点类型,包括基础字幕生成、高级字幕生成和批量处理等功能,能够满足不同场景下的字幕处理需求。
如果在使用过程中遇到问题,可以参考项目文档或在相关社区寻求帮助。
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考








