第二式:MiniGPT4模型训练与部署
1.环境搭建
1.1 下载MiniGPT-4代码
$ git clone https://github.com/Vision-CAIR/MiniGPT-4.git
1.2 创建虚拟环境
$ cd MiniGPT-4
$ conda env create -f environment.yml
$ conda activate minigpt4
说明:也可以用其他的方式创建虚拟环境,创建虚拟环境的主要目的是安装environment.yml中的依赖库。
2.Vicuna模型准备
2.1 下载vicuna delta weights
下载7b delta weights:
$ git lfs install
$ git clone https://huggingface.co/lmsys/vicuna-7b-delta-v1.1
下载13b delta weights:
$ git lfs install
$ git clone https://huggingface.co/lmsys/vicuna-13b-delta-v1.1
请注意:这不是直接的 working weight ,而是LLAMA-13B的 working weight 与 original weight 的差值。(由于LLAMA的规则,我们无法提供LLAMA的 weight )
2.2 下载原始llama weights
您需要按照HuggingFace提供的 原始权重 或 从互联网上获取 HuggingFace格式的原始LLAMA-7B或LLAMA-13B 权重。
注:这里直接从HuggingFace下载已转化为HuggingFace格式的原始LLAMA-7B或LLAMA-13B 权重
下载7b 原始 llama weights:
$ git lfs install
$ git clone https://huggingface.co/decapoda-research/llama-7b-hf
下载13b 原始 llama
MiniGPT-4模型训练与部署指南

文章详细阐述了MiniGPT-4模型的训练与部署过程,包括环境搭建、Vicuna和原始LLAMA权重的下载与合成、MiniGPT-4检查点的准备、Bert模型的配置,以及两个预训练阶段的训练步骤。用户需要按照指导下载相关代码和权重文件,并配置模型路径,最后在本地启动和训练模型。
最低0.47元/天 解锁文章
3000

被折叠的 条评论
为什么被折叠?



