【模型训练】在AutoDL上使用LLamaFactory进行模型训练

最新推荐文章于 2025-05-01 07:09:47 发布

洞明智能

最新推荐文章于 2025-05-01 07:09:47 发布

阅读量2.1k

点赞数 18

文章标签：模型训练算力云人工智能

本文链接：https://blog.youkuaiyun.com/Deadwalk/article/details/145052588

版权

前言

在众多的GPU云平台中，AutoDL是我们常用的一个。它因为显卡可快速扩展、实例运行稳定、网络连接速度快，深受大家的喜爱。不过其端口映射略微复杂，所以本篇文章，我们将介绍在AutoDL平台上进行模型训练的过程。

环境准备

1.1 创建实例

通过查看LLamaFactory的官方文档，我们可以得知，LLamaFactory的运行需要依赖以下环境：

必需依赖	最低版本	推荐版本
python	3.8	3.11
torch	1.13.1	2.4.0
transformers	4.41.2	4.43.4
datasets	2.16.0	2.20.0
accelerate	0.30.1	0.32.0
peft	0.11.1	0.12.0
trl	0.8.6	0.9.6

可选依赖	最低版本	推荐版本
CUDA	11.6	12.2
deepspeed	0.10.0	0.14.0
bitsandbytes	0.39.0	0.43.1
vllm	0.4.3	0.5.0
flash-attn	2.3.0	2.6.3

根据以上的依赖环境版本，我们在AutoDL上选择较为稳定的Pytorch2.3.0+Python3.12+CUDA12.1。

1.2 (可选)无卡模式运行

AutoDL实例创建成功之后，默认是带着显卡启动运行的，此时的费用是2元/小时。
因为我们前期进行环境部署以及拉取数据，暂时不涉及训练部分，也就用不到GPU。
这种情况下，我们可以将实例关闭之后以无卡模式运行。

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

洞明智能

关注关注

18
点赞
踩
22

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
打赏
打赏
打赏举报

举报

AI大模型探索之路-训练篇25：ChatGLM3微调实战-基于LLaMA-Factory微调改造企业级知识库

寻道AI，探索AI无限可能！

05-20

1万+

在当前信息技术迅猛发展的时代，知识库的构建与应用已成为企业竞争的关键。随着自然语言处理技术的不断进步，基于微调的企业级知识库改造落地方案受到越来越多的关注。在前面的系列篇章中我们分别实践了基于CVP架构-企业级知识库实战落地和基于基于私有模型GLM-企业级知识库开发实战；本文将深入探讨和实践一种基于微调技术的企业级知识库改造方法，以期为企业提供更加高效、安全和可靠的知识管理解决方案。

llamafactory0.9.0微调qwen2vl

liguandong

09-24

850

llamafactory cli中的chat是不支持输入图片的，因此输入图片只能通过webchat来实现。改一下src/llamafactory/webui/inference.py中的87行，加一个server_port即可。Qwen2VL微调数据集的图片数量有无限制 · Issue #5375 · hiyouga/LLaMA-Factory · GitHub。其实llamafactory 0.9.0真不如以前的方式，现在的llamafactory-cli不好用，并不适合算法人员。

参与评论您还未登录，请先登录后发表或查看评论

AutoDL算力云使用流程（保姆级教程）

最新发布

qq_54556560的博客

05-01

3861

（2）需要自己配置环境：选择Miniconda，然后选择自己需要的conda版本、cuda版本、python版本，之后再进行pytorch的安装以及环境配置（需要自己配置环境）。选择「无卡模式启动」可暂停实例节省费用（关机后仅存储计费），在上传数据，上传代码，修改代码等等不需要使用GPU时，记得使用无卡模式启动，免得浪费租用GPU的钱。我的镜像：会显示你之前创建过的镜像，如果需要的跟你之前项目相同的等环境，则不需要重新配置，直接就可以再次创建，这里有我之前的镜像FeatDepth1。

在autodl平台使用llama-factory微调Qwen1.5-7B

yidao0618的博客

05-01

4383

“output”: “尽管我们相聚的时光有限，但是相聚的意义在于创造美好的回忆和珍贵的关系。相聚让我们感受到彼此的关怀、支持和友情。最重要的是，相聚能够带给我们真实的人际交往和情感交流，让我们感受到生活的丰富和美好。“output”: “尽管我们相聚的时光有限，但是相聚的意义在于创造美好的回忆和珍贵的关系。最重要的是，相聚能够带给我们真实的人际交往和情感交流，让我们感受到生活的丰富和美好。 “input”: “天下没有不散的筵席，那么我们相聚的意义又是什么”,

AutoDL中的LLaMA-Factory 使用

CSPhD-winston的博客

10-24

1882

我们在autdl上有LLaMA-Factory的镜像，这个镜像用的是Qwen2-7B-Chat，然后我们在Qwen的官网上找到了对应。通过上面的例子，我们知道了模型的选择与下载。打开VPN用迅雷下载。

AutoDL算力云使用llama_factory微调Qwen2.5-7B实战

qq_49379293的博客

11-15

1126

对于正在研究的大模型数理化增强项目需要使用llama_factory对Qwen2.5进行微调，由于之前进行Yolov8研究AutoDL算力云给我留下了方便快捷、价廉物美的印象，所以这次继续在AutoDL算力云上进行研究。AutoDL算力云是一个非常方便快捷且物美价廉的平台，提供的按小时租赁服务器的服务能够极大地满足我们的训练需要，尤其是对于囊中羞涩的学生党来说。如果你也想要像我一样使用llama_factory进行大模型微调，AutoDL算力云是一个绝佳的选择。

#AutoDL #GPU #租显卡 --基于Autodl和llama-factory微调千问7b大模型

qq_51987242的博客

11-11

1208

#AutoDL #GPU #租显卡#大模型微调，手把手教你如何使用AutoDL和llama-factory进行千问7B模型微调

基于autodl与llama-factory部署llama3-8B开源大模型

2201_75499442的博客

06-23

1213

部署llama3过程

基于AutoDL云计算平台+LLaMA-Factory训练平台微调本地大模型

琴智冰

01-21

1836

根据需求选择合适的GPU资源，例如NVIDIA RTX 4090等。：在WebUI中选择已下载的预训练模型（如通义千问7B-chat）。：根据需求设置微调的超参数（如学习率、批次大小、训练轮数等）。：实例启动后，通过平台的JupyterLab快捷工具进入。：选取包含深度学习环境的镜像，避免后续手动配置训练环境。：通过输入测试问题，验证模型的对话能力是否满足预期。：确保所选GPU资源的性能满足训练需求。：点击“开始微调”按钮，启动微调过程。：在WebUI中加载微调后的模型。：将微调后的模型保存到指定路径。

【模型部署】在AutoDL上使用Xinference部署模型

Deadwalk的专栏

01-10

1639

在【模型训练】在AutoDl上使用LLamaFactory进行模型训练中，我们介绍了如何通过SSH建立隧道，进而访问LLamaFactory进行模型训练。本章，我们将介绍如何通过Xinference进行模型推理服务的部署。AutoDL平台正常情况下，不对外提供Http或Https服务，所以需要通过SSH隧道建立连接。AutoDL平台安装引擎会失败，所以本例中改为使用vllm引擎。AutoDL平台默认没有安装Git-LFS，所以通过手动安装。

autodl 上使用 LLaMA-Factory 微调中文版 llama3

Debroon

05-08

4773

模型路径：/root/autodl-tmp/LLM-Research/Meta-Llama-3-8B-Instruct。adapter开头的就是 LoRA 保存的结果了，后续用于模型推理融合。强烈建议选 4090（24G），不然微调的显存不够。我们用 LoRA 微调，至少得 16G（7B模型）。俩个地方都要改：file_name、本地数据集路径。这个数据，ta会去hf官方找，我们可以设置镜像站。微调后，还可以马上测试微调结果。微调后，就找这个路径看一下。方法二：改成本地文件路径。

Pycharm连接云算力远程服务器（AutoDL）训练深度学习模型全过程_autodl连接pycharm

qd520_1314的博客

04-12

6147

最近很多小伙伴找我要Linux学习资料，于是我翻箱倒柜，整理了一些优质资源，涵盖视频、电子书、PPT等共享给大家！

如何使用AutoDl平台跑自己的模型（纯干货，步骤很详细）

热门推荐

qq_45073592的博客

10-17

3万+

记录我使用AutoDL云服务器来跑自己模型的全过程

【LLaMA-Factory】【autoDL】：大模型微调实践

qq_53690996的博客

10-23

3393

后面我仔细阅读文档，修改了 dataset_info.json文件，可以通过数据，达到内存溢出哪一步。但是结果路径也可以直接使用训练结果的文件夹，会有训练成功的下拉框选项。更改模型：因为我的数据是对话模式的，所以需要使用chat级别的模型。小点的模型已经尝试过，还有清理碎片，释放显存等。模型名称：选择要微调的模型，例如LLaMA3-8B-Chat。更改为chat模型后，仍然和instruct模型相同的错误。所以我选择换回我的instruct模型，仍然溢出。语言：选择模型支持的语言，例如zh。

微调神器LLaMA-Factory官方保姆级教程来了，从环境搭建到模型训练评估全覆盖

lqfarmer的博客

07-06

4567

数据集的格式要求在不同的阶段是不同的，本教程以sft阶段的数据集需求，将以系统自带的identity数据集和将自定义的一个商品文案生成数据集为例，介绍数据集的使用。更多详情可以在https://github.com/hiyouga/LLaMA-Factory/blob/main/data/README_zh.md 中找到相关解释。系统目前支持 alpaca 和sharegpt两种数据格式，以alpaca为例，整个数据集是一个json对象的list，具体数据格式为。

用 LLaMA-Factory 在魔搭微调千问

hawk2014bj的博客

04-15

1839

今天在魔搭上把千问调优跑通了，训练模型现在在 Mac 还不支持，需要用 N 卡才可以，只能弄个N 卡的机器，或者买个云服务器。魔搭可以用几十个小时，但是不太稳定，有的时候会自动停止。

llama factory安装与启动

weixin_41860665的博客

08-10

370

基础环境：Ubuntu 22.04.1 LTS \n \l安装命令：登录后复制 git clone https://github.com/hiyouga/LLaMA-Factory.git conda create -n llama_factory python=3.10 conda activate llama_fac...

基于autodl与llama-factory微调llama3（一）

2201_75499442的博客

06-23

889

基于本地数据集微调llama3

autodl llamafactory 微调部署 ollama

01-18

### 使用 AutoDL 和 LlamaFactory 进行模型微调及在 Ollama 上部署 #### 准备工作为了顺利进行模型的微调以及后续部署，需先准备好必要的环境。这包括但不限于安装依赖库、准备数据集等。对于环境配置方面，在使用 LLama-Factory 工具前，确保已经正确设置了开发环境[^2]。具体来说，国内用户可以通过访问魔搭社区来获取所需的预训练模型资源，并利用 SDK 提供的功能实现自动化下载流程[^4]。 #### 模型下载与初始化当选择了合适的模型版本之后（例如 Qwen 或者 Meta-Llama），就可以着手将其拉取到本地环境中： ```python from modelscope.hub.snapshot_download import snapshot_download model_dir = snapshot_download( 'LLM-8B-Instruct', cache_dir='/root/autodl-tmp', revision='master' ) ``` 这段代码会把指定仓库中的最新版模型文件克隆至 `/root/autodl-tmp` 路径下[^5]。 #### 微调过程概述接下来是对选定的基础模型实施针对性优化的过程——即所谓的“微调”。这里将以 `Qwen2-7B` 为例介绍具体的步骤。整个过程中涉及到了多个方面的考量和技术细节处理，比如参数调整策略的选择、超参范围设定等等。 #### 实施微调操作实际执行微调时，则借助于专门设计用于简化这一复杂任务的工作流工具 —— LLaMA-Factory 来完成。该工具不仅提供了图形界面支持，还允许开发者自定义脚本以满足特定场景下的需求[^3]。假设现在要对已有的 FP16 版本的语言模型应用 4-bit 的量化技术以便减少存储空间占用率的同时保持性能水平不变： ```bash ./quantize \ ./models/your_model/xxx \ ./models/your_model/xxx_q4_0 \ q4_0 ``` 上述命令实现了将原始浮点精度较高的权重矩阵压缩成更低位宽表示形式的目标，从而有助于提高推理效率和降低硬件成本开销。 #### 部署至 Ollama 平台最后一步便是让经过精心打磨后的定制化模型能够在生产环境中稳定运行起来。为此，可以考虑采用 Ollama 所提供的便捷接口来进行快速上线测试： ```bash ollama run llama3-merged ``` 这条指令表明只要事先完成了相应的注册手续，就能轻松地通过简单的命令组合方式激活目标服务实例[^1]。