ConsistI2V：增强图像到视频生成的视觉一致性-优快云博客

本文链接：https://blog.youkuaiyun.com/gitblog_00211/article/details/141802426

ConsistI2V：增强图像到视频生成的视觉一致性

ConsistI2VConsistI2V: Enhancing Visual Consistency for Image-to-Video Generation项目地址:https://gitcode.com/gh_mirrors/co/ConsistI2V

项目介绍

ConsistI2V 是一个旨在提升图像至视频（Image-to-Video）生成中视觉一致性的开源项目。该方法由Weiming Ren等人提出，并在2024年的 Transactions on Machine Learning Research (TMLR) 上发表论文《ConsistI2V: 增强图像到视频生成的视觉一致性》。它通过引入对初始帧的空间及运动一致性保持的时空注意力机制以及从低频带提取噪声初始化的方式，显著提高了生成视频的一致性。项目利用扩散模型，解决了现有技术在维护序列内视觉稳定性方面的挑战。

项目快速启动

环境准备

首先，需要安装必要的软件包并设置Conda环境：

git clone https://github.com/TIGER-AI-Lab/ConsistI2V.git
cd ConsistI2V
conda env create -f environment.yaml
conda activate consisti2v

视频生成示例

要使用ConsistI2V生成视频，需修改配置文件以指定输入提示和推理参数，然后执行以下命令：

python -m scripts.animate \
    --inference_config configs/inference/inference.yaml \
    --prompt_config configs/prompts/default.yaml \
    --format mp4

确保inference.yaml中的pretrained_model_path设为默认值TIGER-Lab/ConsistI2V或本地模型路径，以便下载或使用模型。