如何安装和使用vicuna

本文详细介绍了如何在虚拟环境中安装和使用Vicuna,一个基于LLaMA微调的大型语言对话模型。步骤包括创建Python 3.8以上的虚拟环境,安装torch和transformers库,克隆项目,下载并转换LLaMA模型,合并模型参数,以及在GPU或CPU上运行模型。

Vicuna 是基于 LLaMa 微调得来的大规模语言对话模型。

本文以 Vicuna-7B 模型为例,安装和使用 Vicuna。若需使用 Vicuna-13B 模型,仅需把参数 7B 改成 13B 即可。

0. 虚拟环境

在 conda 中创建虚拟环境,python 版本要求在 3.8 以上:https://blog.youkuaiyun.com/Yu_L2/article/details/105186991

虚拟环境还要安装 torch:https://pytorch.org/get-started/previous-versions/

以及 transformers:https://huggingface.co/docs/transformers/installation

等库。

1. 克隆项目到本地

克隆 Vicuna 库到本地。

git clone https://github.com/lm-sys/FastChat.git

2.安装LLaMA

可以通过以下命令下载 LLaMA。

pip install pyllama -U
python -m llama.download --model_size 7B

【提示】模型下载速度较慢,可以通过 Ctrl+C 终止下载,再重新运行该命令继续下载。

3.转换模型

下载

Vicuna是由加州大学伯克利分校等机构基于 Meta 的LLaMA-13B模型微调而来的开源大语言模型,通过使用约 7 万条用户共享的对话数据(来自 ShareGPT)进行优化,在对话能力上表现接近 ChatGPT(GPT-3.5) [^2]。 Vicuna模型具有以下特点:基于开源的LLaMA模型进行微调,具备开源的优势,方便开发者使用研究;对话能力表现出色,接近ChatGPT(GPT - 3.5)的水平,能较好地处理各种对话场景 [^2]。 在使用方面,Vicuna模型的官方文档详尽地介绍了模型的安装、配置使用方法,适合初学者经验丰富的开发者快速上手。文档中包含了模型的基本概念、命令行接口的使用、API调用方法等内容 [^1]。以下是一些使用示例: - 若要体验llama - 7B、vicuna - 7b - delta - v1.1vicuna - 7b - v1.3,可使用如下命令: ```python python3 -m cli --model-path /root/vicuna-7b/vicuna-7b-delta-v11 --device cpu ``` 此命令会加载模型检查点分片 [^3]。 - 启动小羊驼的服务端命令示例: ```python CUDA_VISIBLE_DEVICES='4,5' python -m fastchat.serve.cli --model-path /home/hcx/out/model/vicuna-7b --num-gpus 2 ``` - webGUI模型启动小羊驼的步骤及命令: - 启动controller服务: ```python python3 -m fastchat.serve.controller ``` - 启动work服务: ```python CUDA_VISIBLE_DEVICES='1,2' python -m fastchat.serve.model_worker --model-path /home/hcx/out/model/vicuna-7b --num-gpus 2 ``` - 测试controller与worker服务是否连通: ```python python3 -m fastchat.serve.test_message --model-name vicuna-7b ``` - 启动Gradio web server: ```python python -m fastchat.serve.gradio_web_server ``` 访问IP:7860即可 [^5]。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值