详细安装和配置指南-优快云博客

本文链接：https://blog.youkuaiyun.com/gitblog_00420/article/details/147086592

详细安装和配置指南

InvSR Arbitrary-steps Image Super-resolution via Diffusion Inversion (CVPR 2025) 项目地址: https://gitcode.com/gh_mirrors/in/InvSR

1. 项目基础介绍

本项目是一个名为InvSR的开源项目，其全称为“Arbitrary-steps Image Super-resolution via Diffusion Inversion”，旨在通过扩散反转技术实现任意步数的图像超分辨率。该项目基于大型预训练的扩散模型，利用其中丰富的图像先验知识，提升超分辨率性能。主要编程语言为Python。

2. 关键技术和框架

扩散模型：项目利用扩散模型强大的图像生成能力，通过特殊的噪声预测策略，优化图像的超分辨率过程。
噪声预测：核心是一个深度噪声预测器，用于估计前向扩散过程中的最优噪声图。
PyTorch：使用PyTorch深度学习框架进行模型的训练和测试。
xformers：用于加速注意力机制的计算。

3. 安装和配置

准备工作

在开始安装之前，请确保您的系统中已经安装了以下环境：

Python 3.10
conda（推荐使用conda来管理Python环境和包）

安装步骤

创建并激活conda环境

conda create -n invsr python=3.10
conda activate invsr

安装PyTorch和相关依赖

pip install torch==2.4.0 torchvision==0.19.0 torchaudio==2.4.0 --index-url https://download.pytorch.org/whl/cu121
pip install -U xformers==0.0.27.post2 --index-url https://download.pytorch.org/whl/cu121

安装项目依赖

pip install -e ".[torch]"
pip install -r requirements.txt

运行项目

如果只是想要测试项目效果，可以运行以下命令进行快速测试：
```
python inference_invsr.py -i [image folder/image path] -o [result folder] --num_steps 1
```
如果要使用Docker容器运行项目，可以执行以下命令：
```
docker compose up -d
```
然后在浏览器中访问 http://127.0.0.1:7860/。
训练模型

如果需要进行模型训练，请确保下载了预训练的LPIPS模型并将其放在项目的weights文件夹中。准备好训练和验证数据，并设置正确的路径在配置文件中。使用以下命令开始训练：
```
CUDA_VISIBLE_DEVICES=0,1,2,3 torchrun --standalone --nproc_per_node=4 --nnodes=1 main.py --save_dir [Logging Folder]
```
如果需要从上次中断的地方继续训练，可以使用：
```
CUDA_VISIBLE_DEVICES=0,1,2,3 torchrun --standalone --nproc_per_node=4 --nnodes=1 main.py --save_dir [Logging Folder] --resume save_dir/ckpts/model_xx.pth
```