LLaMA Factory+ModelScope实战——使用 Web UI 进行监督微调

LLaMA Factory+ModelScope实战——使用 Web UI 进行监督微调

文章原始地址:https://onlyar.site/2024/01/14/NLP-LLaMA-Factory-web-tuning/

引言

大语言模型微调一直都是一个棘手的问题,不仅因为需要大量的计算资源,而且微调的方法也很多。在尝试每种方法过程中,配置环境和第三方库也颇为麻烦。。而 LLaMA Factory1 是一个高效的大语言模型训练和推理的框架,不仅集成多种高效训练方法,而且能持续适配国内外各种开源大模型。该框架还提供了能够一站式实现大模型预训练、监督微调、评估、推理的 Web UI 界面,使用户能够直观地看到训练选项、模型数据集选项、训练进度等重要信息。

为方便国内用户使用,该框架支持了魔搭社区(ModelScope)的模型和数据集资源,训练前可自动下载并缓存资源。

而 Yi 系列大模型2是李开复博士创办的“零一万物”公司研发的首款开源大模型。参数规模有 6B 和 34B。其中的 Yi-34B 不仅支持 200K tokens 的超长窗口,更是在众多性能评测榜单上取得领先成绩。

本次我们基于 LLaMA Factory 框架,在一张 V100 显卡上使用 ModelScope 上支持的在线数据集对 Yi-6B 模型进行监督微调,使其获得对话能力。

环境准备

LLaMA Factory框架目前托管在 github 上,所以,我们要先使用 git 来安装 LLaMA Factory 开源框架:

git clone https://github.com/hiyouga/LLaMA-Factory.git

等待仓库下载完毕,进入仓库并安装所需依赖:

cd LLaMA-Factory
pip install -r requirements.txt

注意:截至文章编辑时(2024 年 1 月 22 日),该框架在使用最新版本的 torch 库时,会出现无法正常推理的情况。请根据您的硬件环境选择合适的 torch 版本进行安装,版本范围为 torch>=1.13.1,<=2.0.1。

Web UI 的使用

服务的启动

首先我们要在命令行里设置一个环境变量 USE_MODELSCOPE_HUB=1,框架程序在运行时会读取这个环境变量,当 USE_MODELSCOPE_HUB 的值为 1 时框架才会使用 ModelScope 在线资源。在 Windows 和 Linux 操作系统上,设置环境变量的命令是不同的,请二选其一:

export USE_MODELSCOPE_HUB
### 安装和配置LLaMA-Factory-webui于Windows操作系统 #### 准备工作 为了顺利安装并运行LLaMA-Factory-webui,建议先创建一个专门用于此目的的Conda环境。这能够有效避免不同软件包之间的冲突,并简化依赖项管理[^2]。 ```bash conda create --name llama_factory_env python=3.9 conda activate llama_factory_env ``` #### 下载与安装 获取LLaMA-Factory源码可以通过Git克隆官方仓库实现: ```bash git clone https://github.com/your-repo-url/llama-factory.git cd llama-factory ``` 接着按照项目文档中的指示来设置必要的Python库和其他外部依赖。通常情况下会有一个`requirements.txt`文件列出了所需的所有Python模块;通过pip命令可以直接完成这些依赖的安装: ```bash pip install -r requirements.txt ``` 对于特定硬件加速支持(比如CUDA),可能还需要额外安装相应的驱动程序以及PyTorch版本。 #### 启动WebUI服务 当所有的准备工作完成后,就可以尝试启动Web应用程序了。一般而言,在项目的根目录下执行如下脚本可以开启HTTP服务器监听本地端口7860: ```bash python app.py ``` 此时应该可以在浏览器地址栏输入`http://localhost:7860`来访问到LLaMA-Factory的图形化操作界面[^1]。 #### 配置模型路径 为了让应用正常加载指定的大规模语言模型,需正确设定模型的位置参数。具体来说就是指明已提前下载好的基础模型所在的绝对路径(`model_path`),还有经过微调之后保存下来的权重文件所在位置(`checkpoint_path`)。后者默认位于LLaMA-Factory工程下的`saves`子目录内[^4]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值