IterComp是一个由清华大学、北京大学、LibAI Lab、中国科学技术大学、牛津大学和普林斯顿大学等多所高校的研究人员联合推出的文本到图像生成框架。
IterComp框架的核心目标是通过迭代反馈学习机制来提升基础扩散模型在组合性生成任务中的表现。
IterComp提出了第一个基于奖励控制的迭代组合感知框架,旨在全面提升基础扩散模型的组合性。
通过精心挑选模型库并收集来自不同模型的组合生成偏好,IterComp能够有效地提取和整合这些偏好,从而生成更高质量的图像。
IterComp的应用场景广泛,包括但不限于艺术创作、设计辅助以及任何需要将文字描述转换为视觉内容的领域。
github项目地址:https://github.com/YangLing0818/IterComp。
一、环境安装
1、python环境
建议安装python版本在3.10以上。
2、pip库安装
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
3、模型下载:
git lfs install
git clone https://huggingface.co/comin/IterComp
二、功能测试
1、运行测试:
(1)python代码调用测试
from diffusers import DiffusionPipeline
import torch
def load_model(model_path, de