【模型训练】在AutoDL上使用LLamaFactory进行模型训练

前言

在众多的GPU云平台中,AutoDL是我们常用的一个。它因为显卡可快速扩展、实例运行稳定、网络连接速度快,深受大家的喜爱。不过其端口映射略微复杂,所以本篇文章,我们将介绍在AutoDL平台上进行模型训练的过程。

环境准备

1.1 创建实例

通过查看LLamaFactory的官方文档,我们可以得知,LLamaFactory的运行需要依赖以下环境:

必需依赖 最低版本 推荐版本
python 3.8 3.11
torch 1.13.1 2.4.0
transformers 4.41.2 4.43.4
datasets 2.16.0 2.20.0
accelerate 0.30.1 0.32.0
peft 0.11.1 0.12.0
trl 0.8.6 0.9.6
可选依赖 最低版本 推荐版本
CUDA 11.6 12.2
deepspeed 0.10.0 0.14.0
bitsandbytes 0.39.0 0.43.1
vllm 0.4.3 0.5.0
flash-attn 2.3.0 2.6.3

根据以上的依赖环境版本,我们在AutoDL上选择较为稳定的Pytorch2.3.0+Python3.12+CUDA12.1

1.2 (可选)无卡模式运行

  • AutoDL实例创建成功之后,默认是带着显卡启动运行的,此时的费用是2元/小时。
  • 因为我们前期进行环境部署以及拉取数据,暂时不涉及训练部分,也就用不到GPU。
  • 这种情况下,我们可以将实例关闭之后以无卡模式运行。

### 使用 AutoDLLlamaFactory 进行模型微调及在 Ollama 上部署 #### 准备工作 为了顺利进行模型的微调以及后续部署,需先准备好必要的环境。这包括但不限于安装依赖库、准备数据集等。 对于环境配置方面,在使用 LLama-Factory 工具前,确保已经正确设置了开发环境[^2]。具体来说,国内用户可以通过访问魔搭社区来获取所需的预训练模型资源,并利用 SDK 提供的功能实现自动化下载流程[^4]。 #### 模型下载与初始化 当选择了合适的模型版本之后(例如 Qwen 或者 Meta-Llama),就可以着手将其拉取到本地环境中: ```python from modelscope.hub.snapshot_download import snapshot_download model_dir = snapshot_download( 'LLM-8B-Instruct', cache_dir='/root/autodl-tmp', revision='master' ) ``` 这段代码会把指定仓库中的最新版模型文件克隆至 `/root/autodl-tmp` 路径下[^5]。 #### 微调过程概述 接下来是对选定的基础模型实施针对性优化的过程——即所谓的“微调”。这里将以 `Qwen2-7B` 为例介绍具体的步骤。整个过程中涉及到了多个方面的考量和技术细节处理,比如参数调整策略的选择、超参范围设定等等。 #### 实施微调操作 实际执行微调时,则借助于专门设计用于简化这一复杂任务的工作流工具 —— LLaMA-Factory 来完成。该工具不仅提供了图形界面支持,还允许开发者自定义脚本以满足特定场景下的需求[^3]。 假设现在要对已有的 FP16 版本的语言模型应用 4-bit 的量化技术以便减少存储空间占用率的同时保持性能水平不变: ```bash ./quantize \ ./models/your_model/xxx \ ./models/your_model/xxx_q4_0 \ q4_0 ``` 上述命令实现了将原始浮点精度较高的权重矩阵压缩成更低位宽表示形式的目标,从而有助于提高推理效率和降低硬件成本开销。 #### 部署至 Ollama 平台 最后一步便是让经过精心打磨后的定制化模型能够在生产环境中稳定运行起来。为此,可以考虑采用 Ollama 所提供的便捷接口来进行快速上线测试: ```bash ollama run llama3-merged ``` 这条指令表明只要事先完成了相应的注册手续,就能轻松地通过简单的命令组合方式激活目标服务实例[^1]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

洞明智能

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值