告别单模态局限!MM-Diff本地部署教程:多模态时代的生产力引擎

一、MM-Diff简介

MM-Diff:通过多模态条件集成实现高保真图像个性化

MM-Diff,这是一个统一且无需调整的图像个性化框架,能够在几秒钟内生成单个和多个主题的高保真图像。在左侧,视觉增强文本嵌入和一小组细节丰富的主题嵌入通过精心设计的多模态交叉注意注入扩散模型。在右侧,我们说明了使用 LoRA 创新实现交叉注意力的细节,以及促进多主体生成的注意力约束。

二、本地部署流程

环境版本
Python>=3.9.0
PyTorch=2.0.0
Ubtuntu=22.4.0
CUDA=11.8

1.创建虚拟环境

1.1 安装 Miniconda

步骤 1:更新系统
首先,更新您的系统软件包:

sudo apt update
sudo apt upgrade -y

步骤 2:下载 Miniconda 安装脚本
访问 Miniconda 的官方网站或使用以下命令直接下载最新版本的安装脚本(以 Python 3 为例):

wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh

步骤 3:验证安装脚本的完整性(可选)
下载 SHA256 校验和文件并验证安装包的完整性:

wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh.sha256
sha256sum Miniconda3-latest-Linux-x86_64.sh

比较输出的校验和与.sha256 文件中的值是否一致,确保文件未被篡改。

步骤 4:运行安装脚本
为安装脚本添加执行权限:

chmod +x Miniconda3-latest-Linux-x86_64.sh

运行安装脚本:

./Miniconda3-latest-Linux-x86_64.sh

步骤 5:按照提示完成安装
安装过程中,您需要:

阅读许可协议 :按 Enter 键逐页阅读,或者按 Q 退出阅读。
接受许可协议 :输入 yes 并按 Enter。
选择安装路径 :默认路径为/home/您的用户名/miniconda3,直接按 Enter 即可,或输入自定义路径。
是否初始化 Miniconda :输入 yes 将 Miniconda 添加到您的 PATH 环境变量中。
步骤 6:激活 Miniconda 环境
安装完成后,使环境变量生效:

source ~/.bashrc

步骤 7:验证安装是否成功
检查 conda 版本:

conda --version

步骤 8:更新 conda(推荐)
为了获得最新功能和修复,更新 conda:

conda update conda

1.2.创建虚拟环境

conda create -n mmdiff python=3.9

2.下载 PyTorch

#进入虚拟环境
conda activate mmdiff
#下载pytorch
pip install torch==2.0.0 torchvision==0.15.1 torchaudio==2.0.1 --index-url https://download.pytorch.org/whl/cu118

3.克隆MM-Diff仓库

自动下载:

git clone https://github.com/alibaba/mm-diff.git

本地下载

网址:alibaba/mm-diff: MM-Diff: High-Fidelity Image Personalization via Multi-Modal Condition Integration

4.安装依赖

由于MM-Diff使用的PyTorch是1.13.1,但是这个版本的torch已经不在维护,并且不能安装,因此使用了torch==2.0.0

为了避免版本冲突,推荐使用下面的requirements.tsx文件来安装相关依赖

分享文件:requirements.txt
链接:https://pan.xunlei.com/s/VOPhbOL9Dc5hNkYvlj1ifMinA1?pwd=z2wu#
复制这段内容后打开迅雷,查看更方便

注意使用时请先删除原本的requirements.txt文件

pip install -r requirements.txt

5.启动MM-Diff

5.1 下载模型

MM-Diff使用的是Hugging Face中的模型由于网络的问题可能会下载不成功,因此推荐下载到本地使用,若是能过自动下载的可以跳过此步骤

若空间足够推荐下载到/mm-diff/wen文件中(大约32GB)

Hugging Face

下面是hugging中模型的网址

ModelScope(推荐)

修改模型路径(若下载到的是/mm-diff中可不用修改)
文件路径:/mm-diff/mmdiff_gradio_demo.py

修改以下几行:

image.png

5.2 启动

使用下面的命令来启动MM-Diff

python mmdiff_gradio_demo.py

运行结果

image.png

在浏览器中输入一下网址即可进入MM-Diff的gradio页面

http://127.0.0.1:8080

image.png

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值