MiniGPT4模型训练与部署

MiniGPT-4模型训练与部署指南
文章详细阐述了MiniGPT-4模型的训练与部署过程,包括环境搭建、Vicuna和原始LLAMA权重的下载与合成、MiniGPT-4检查点的准备、Bert模型的配置,以及两个预训练阶段的训练步骤。用户需要按照指导下载相关代码和权重文件,并配置模型路径,最后在本地启动和训练模型。

1.环境搭建

1.1 下载MiniGPT-4代码

$ git clone https://github.com/Vision-CAIR/MiniGPT-4.git

1.2 创建虚拟环境

$ cd MiniGPT-4
$ conda env create -f environment.yml
$ conda activate minigpt4

说明:也可以用其他的方式创建虚拟环境,创建虚拟环境的主要目的是安装environment.yml中的依赖库。

2.Vicuna模型准备

2.1 下载vicuna delta weights

下载7b delta weights:

$ git lfs install
$ git clone https://huggingface.co/lmsys/vicuna-7b-delta-v1.1

下载13b delta weights:

$ git lfs install
$ git clone https://huggingface.co/lmsys/vicuna-13b-delta-v1.1

请注意:这不是直接的 working weight ,而是LLAMA-13B的 working weight 与 original weight 的差值。(由于LLAMA的规则,我们无法提供LLAMA的 weight )

2.2 下载原始llama weights

您需要按照HuggingFace提供的 原始权重 或 从互联网上获取 HuggingFace格式的原始LLAMA-7B或LLAMA-13B 权重。
注:这里直接从HuggingFace下载已转化为HuggingFace格式的原始LLAMA-7B或LLAMA-13B 权重
下载7b 原始 llama weights:

$ git lfs install
$ git clone https://huggingface.co/decapoda-research/llama-7b-hf

下载13b 原始 llama

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值