ComfyUI字幕增强插件安装配置指南

ComfyUI字幕增强插件安装配置指南

【免费下载链接】ComfyUI_SLK_joy_caption_two ComfyUI Node 【免费下载链接】ComfyUI_SLK_joy_caption_two 项目地址: https://gitcode.com/gh_mirrors/co/ComfyUI_SLK_joy_caption_two

ComfyUI_SLK_joy_caption_two是一个基于ComfyUI的字幕处理插件,它实现了JoyCaptionAlpha Two的功能,支持批量字幕处理和多种模型切换。

准备工作

在开始安装前,请确保您的系统满足以下要求:

  • Python 3.7或更高版本
  • Git工具已安装
  • ComfyUI基础环境就绪

安装步骤

第一步:获取项目文件

将项目克隆到您的custom_nodes目录:

cd custom_nodes
git clone https://gitcode.com/gh_mirrors/co/ComfyUI_SLK_joy_caption_two.git

第二步:安装依赖包

进入项目目录并安装必要的依赖:

pip install -r ComfyUI_SLK_joy_caption_two/requirements.txt

依赖包包括:

  • huggingface-hub>=0.23.4
  • transformers>=4.44.0
  • numpy==1.26.4
  • sentencepiece==0.2.0
  • pillow>=10.4.0
  • bitsandbytes>=0.44.1
  • peft>=0.12.0

第三步:下载核心模型

根据项目需求下载以下模型并放置到指定位置:

1. google/siglip-so400m-patch14-384模型 将模型文件复制到 models/clip/siglip-so400m-patch14-384 目录下。

CLIP模型配置

2. Llama3.1-8B-Instruct模型 支持两个版本:

  • bnb-4bit版本(适合小显存用户)
  • 原版模型(需要更多显存资源)

将下载的模型文件复制到对应的 models/LLM/ 子目录中。

Llama模型配置

3. Joy-Caption-alpha-two模型(必须手动下载) 下载模型文件夹的所有内容并复制到 models/Joy_caption_two 目录下。

Joy字幕模型配置

第四步:重启验证

完成上述步骤后,重启ComfyUI服务。您现在可以在节点列表中找到新的字幕处理功能。

功能特性

该插件提供了多种字幕处理模式:

  • 描述性字幕(正式语气)
  • 描述性字幕(非正式语气)
  • 训练提示词生成
  • MidJourney提示词
  • Booru标签列表
  • 艺术评论分析
  • 产品列表描述
  • 社交媒体帖子

批量处理功能

插件支持高级批量字幕处理,包括:

  • 批量添加前缀字幕
  • 批量添加后缀字幕
  • 重命名开关控制
  • 支持RGBA透明通道图片处理

工作流示例

可选汉化配置

如果您安装了AIGODLIKE翻译插件,可以添加中文支持:

cp translation/zh-CN/Nodes/Comfyui_SLK_joy_caption_two.json AIGODLIKE-ComfyUI-Translation/zh-CN/Nodes/

使用建议

  • 首次使用时建议从简单配置开始测试
  • 确保所有模型文件版本符合要求
  • 8G显存环境推荐使用bnb-4bit版本模型
  • 遇到问题时可以查看项目文档获取帮助

批量工作流示例

通过以上步骤,您就能成功安装这个功能强大的ComfyUI字幕增强插件,开始高效的字幕批量处理工作。

【免费下载链接】ComfyUI_SLK_joy_caption_two ComfyUI Node 【免费下载链接】ComfyUI_SLK_joy_caption_two 项目地址: https://gitcode.com/gh_mirrors/co/ComfyUI_SLK_joy_caption_two

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值