CogVideo简介
CogVideo 是由 智谱 AI 联合清华大学开发的开源视频生成模型,其升级版 CogVideoX 于 2024 年发布,集成于智谱的 AI 视频生成工具 清影(Ying) 中。该模型基于多模态技术,支持通过文本或图片生成高质量视频,具备快速响应、高指令遵循能力和物理世界运动还原等特点,适用于教育、影视、营销等多个领域。
CogVideo核心特点
1.快速生成:CogVideoX 能在 30 秒内生成 6 秒视频。
2.高效的指令遵循能力:处理复杂 prompt,准确理解用户意图。
3.内容连贯性:通过 3D VAE 和 RoPE 编码提升时间维度连贯性。
4.画面调度灵活性:镜头跟随移动物体,如专业拍摄。
5.多模态架构:融合文本、时间、空间的三维 Transformer 架构。
CogVideo应用场景
影视创作:快速生成分镜、特效片段。
营销与教育:制作产品演示动画、科普动态图解。
社交媒体:一键生成创意短视频,如 “蘑菇变小熊” 等趣味内容。
开发者生态:通过 API 接入,赋能行业应用(如电商、游戏)。
CogVideo的使用方法
CogVideo现已上线东方超算AI应用商店(访问网址appmall.com),使用价格低至2.3元/小时,平台按分钟数实际计费,比如使用10分钟,那么只会收费约0.4元。
您可以查看《手把手教你玩转AppMall》,了解安装开启站内应用全流程。
操作步骤
采用ComfyUI来使用CogVideo,需要先打开内置的工作流,点击上传图片,填写提示词,本次使用默认提示词:
fireworks display over night city. The video is of high quality, and the view is very clear. High quality, masterpiece, best quality, highres, ultra-detailed, fantastic.
几分钟后将看到生成的视频