LLaMA-Factory LoRA微调 Qwen2.5-1.5B Instruct版本

最新推荐文章于 2025-12-27 11:26:08 发布

原创

最新推荐文章于 2025-12-27 11:26:08 发布 · 823 阅读

7 ·

CC 4.0 BY-SA版权

文章标签：

#llama #人工智能 #算力 #lora #机器学习 #深度学习

(如果是已经看过前面文章的朋友可以直接跳过前段部分即可）

Hello，我是小S，前两篇文章讲了“力大砖飞”的全参微调，那么这篇封笔之作，自然会讲到性价比超高，并且十分优雅的LoRA微调了！

看过前两篇的朋友都知道，我一向是对全参微调十分慷慨，每次都给他上6张4090……虽然用着十分爽，可是就和开油车一样，虽然心灵是满足的，但是钱包是在哭泣的。

虽然全参微调可以让胡言乱语的Base模型开始说人话，也可以让Instruct模型更出色。

但是人有“三高”，大模型也有“三高”：高成本、长时间、大存储。属于是赛博三高了，那么赛博三高就有请赛博医生来治——LoRA微调登场！

LoRA的全称是Low-Rank Adaptation，一看名字就感觉性价比超高的，很“Low”

所以今天，我要做出一个违背祖宗的决定，只用1张4090，搞定LoRA微调！（也是开上了高性价比的电车了）

那么事不宜迟，开始今天的LoRA微调之旅，当最后对比的时候，我会综合对比一下训练出来的结果，并且分享一些我自己的理解给大家。

准备工作

开始当然还是到我们公司的云平台中创建实例咯，和以前不一样的就是，这次我们只需要1张4090！这就是属于LoRA微调的怜悯（对钱包的怜悯）。

在AI模型列表中找到我们需要的那一位，也是上一期的主角，Qwen2.5-1.5B Instruct版本，正好可以对比一下相同模型使用不同的训练方法的差异。

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

SuperTi_cloud

关注关注

11
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

开源模型应用落地-qwen2.5-7b-instruct-LoRA微调-LLaMA-Factory-单机单卡-V100（十八）

以微薄之力，予他人些许温暖.

09-25

2万+

使用LLaMA-Factory高效微调qwen2.5-7b-instruct

LLaMA-Factory 全参微调 Qwen2.5-1.5B Instruct版本

SuperTi_cloud的博客

07-25

1026

本文介绍了使用LLaMA-Factory对Qwen2.5-1.5B Instruct版本进行全参微调的过程。

参与评论您还未登录，请先登录后发表或查看评论

LLaMA-Factory微调sft Qwen2.5-VL-7B-Instruct

q742971636的博客

03-17

3870

"content": "你是一个擅长识别印章上文字的助手，输出json字符串给用户。",},"content": "<image>识别图片里红色印章上的公司名称或单位名称（印章主文字）。",},"content": "{\"印章主文字\": \"饮酒太原近似收益有限公司\"}",],"seal": {},"tags": {

llama factory lora 微调 qwen2.5 7B Instruct模型

weixin_41046245的博客

11-14

5010

项目背景甲方提供一台三卡4080显卡需要进行qwen2.5 7b Instruct模型进行微调。以下为整体设计。要使用对进行，流程与之前提到的模型类似。LoRA 微调是一种高效的微调方法，通过低秩适配器层来调整预训练模型的权重，而不是全量训练整个模型。

Llama-Factory微调Qwen2.5-VL从数据集制作到部署记录

小俊俊的博客

09-08

1519

huggingface由于是外网，下载困难，建议去魔塔社区下载，下载后置于LLama-factory根目录下，新建models文件夹。既然qwen本身具有较好的图像描述能力，那我们可以先使用qwen进行图像描述，在此基础上进行复核修改，这样做可以减少人力成本。因为我是一边测试一边记录，为了安全起见，建议使用anaconda建立LLama-Factory虚拟环境。生成的权重文件在LLama-Factory根目录下的Saves文件夹下。这是最原始的从零开始制作数据集的方法，不建议这样做！内存占用大概22G.

基于LLaMA-Factory微调Qwen2.5-1.5B-Instruct

m0_75149710的博客

11-24

2516

这是modelscope的官网魔搭社区汇聚各领域最先进的机器学习模型，提供模型探索体验、推理、训练、部署和应用的一站式服务。这个服务需要绑定阿里云，没注册的还要注册阿里云。

LLaMA-Factory微调Qwen2.5-7B模型_llamafactory 微调qwen2.5

HUANGXIN9898的博客

04-17

1186

本次实验环境使用的魔塔社区的机子。

LLaMA-Factory微调Qwen2.5-7B模型

qq_46325481的博客

02-19

3098

本次实验环境使用的魔塔社区的机子。

llama-factory+cot数据集，使用lora微调qwen2.5-0.5b

Gu_erye的博客

04-18

1324

python3.11版本大模型准备：下载地址（下载脚本如：需要安装modelscope。

llama-factory 微调 Qwen2.5-3B-Instruct

coco的专栏

03-21

1259

官方 readme: https://github.com/hiyouga/LLaMA-Factory/blob/v0.9.1/README_zh.md官方文档: https://llamafactory.readthedocs.io/zh-cn/latest/官方推荐的知乎教程：https://zhuanlan.zhihu.com/p/695287607 笔者conda环境 Python 包如下：命令行输入：执行截图：关于数据集文件的格式，请参考 data/README_zh.md 的内

llama-factory微调Qwen2.5-7B-instruct实战，看这一篇就够了！！！（含windows和linux）

a1105425455的博客

03-20

2321

llama-factory微调Qwen2.5-7B-instruct实战，看这一篇就够了！！！（含windows和linux）

使用 LLaMA Factory 微调一个 Qwen3-0.6B 猫娘

qq_43650934的博客

12-24

462

本文介绍了使用LLaMA Factory进行大模型微调的全流程。首先需要配置深度学习环境，通过魔搭社区下载Qwen3-0.6B模型。然后准备Alpaca格式数据集，对NekoQA-10K数据集进行格式转换处理。在LLaMA Factory中配置模型路径、选择微调方法（full或lora）、设置训练轮数后即可开始训练。训练完成后可通过Chat功能验证微调效果，最后可将模型导出保存。整个流程涵盖了从环境搭建到模型导出的完整步骤，适合进行大语言模型的定制化训练。

基于昇腾 NPU 部署 Llama-3-8B 实战教程：从环境搭建到构建昇腾问答智能体

kevin_blog

12-25

2万+

本文介绍了在昇腾（Ascend）NPU平台上部署Meta-Llama-3-8B-Instruct大模型的全过程。首先通过npu-smi命令确认硬件状态，安装必要的Python依赖库后，从ModelScope社区下载模型权重文件。文章详细展示了基础推理测试的实现代码，包括环境配置、模型加载和推理生成等核心模块，并验证了模型在NPU上的运行效果。整个流程涵盖了从环境准备到实际部署的关键步骤，为开发者提供了在国产算力平台运行主流大模型的实践参考。

在昇腾 NPU上跑通 Llama 3-8B：从环境部署到 100% 算力满载

2302_79376097的博客

12-25

2万+

Llama 3 是目前开源大模型的“流量担当”，而昇腾 (Ascend) 上的环境则是算力的“扛把子”。如果 AICore 始终很低，说明数据卡在 CPU 预处理上了（CPU 瓶颈），但在本例中，表现出了极佳的吞吐能力。在 FP16 精度下的表现非常强劲，对于企业构建私有化大模型底座而言，它已经不再是“备胎”，而是具备极高性价比的主力选择。最终，模型成功输出了完整的 Python 冒泡排序代码，注释准确，逻辑清晰，无乱码。上进行微调，让模型拥有垂直领域的专业知识，那才是 NPU 真正大显身手的地方。

从 CUDA 到 CANN：昇腾 NPU 环境下 Llama-2 大模型部署

专注于 C/C++ 后端开发，涵盖基础语法、Linux系统与网络、MySQL数据库、常见算法及项目经验。

12-26

1万+

在人工智能的浩瀚星河中，算力是驱动一切的引擎。长久以来，NVIDIA GPU 凭借其强大的通用并行计算能力和成熟的 CUDA 生态，几乎垄断了深度学习训练与推理的市场。然而，随着 AI 模型参数量的爆炸式增长（从 ResNet 的千万级到 GPT-4 的万亿级），通用 GPU 在能效比和特定算子优化上逐渐显露出瓶颈。

【大模型】使用llamafactory 训练 qwen2.5-VL 的目标检测任务

热门推荐

EterNity_TiMe_的计算机学习之路

12-26

2万+

本文介绍了在GitCode云端Notebook环境中部署Meta-Llama-3-8B-Instruct大模型的完整流程。教程从环境准备开始，详细说明了如何利用ModelScope实现模型高速下载，并提供了适配Ascend NPU的推理代码编写方法。文章包含环境检查、模型下载、性能测试和NPU负载监控等关键步骤，同时针对常见问题给出了解决方案。通过图文并茂的方式，作者展示了从零开始部署大模型的全过程，特别适合初次接触NPU环境和大模型开发的用户参考。整个过程在32vCPU、64GB内存的NPU Basic环

微调—— LlamaFactory工具：使用WebUI微调

qq_27246521的博客

12-26

本文介绍了使用LLaMA-Factory进行模型微调的全流程。首先通过命令启动webUI面板，然后准备数据集并注册自定义数据。在微调参数设置中，详细说明了模型选择（Qwen2.5-3B-Instruct）、微调方法（推荐LoRA）、加速方法（liger_kernel）等关键配置。文章还展示了微调前后的模型测试对比，微调后的模型在回答"旅游"问题时表现出更个性化的响应能力。最后介绍了模型导出步骤，可将微调结果保存至指定目录。整个过程涵盖了从数据准备到模型部署的完整流程，体现了LLaMA-F

Qwen2.5-1.5B-Instruct

02-02

### Qwen2.5-1.5B-Instruct Model Information and Usage Guide #### Overview of the Qwen2.5-1.5B-Instruct Model The Qwen2.5 series, including the 1.5 billion parameter version (Qwen2.5-1.5B), is designed specifically to enhance conversational abilities through specialized instruction tuning[^1]. This model variant aims at providing robust performance in dialogue-based applications while maintaining efficiency. #### Installation and Setup Instructions To begin using this particular instantiation of the Qwen architecture: 1. **Source Code Acquisition** For obtaining the necessary source code associated with Qwen2.5-1.5B-Instruct, one should follow standard procedures outlined within documentation or repository guidelines provided by developers[^3]. 2. **Environment Configuration** Ensure that an appropriate environment has been configured on your system which supports running large-scale language models like those from the Qwen family. Considerations include hardware specifications such as GPU availability along with software dependencies required for execution. #### Fine-Tuning Process Details When considering fine-tuning operations involving LORA configurations, it's important to note potential limitations related to memory constraints during training phases even when attempting minimal adjustments: ```yaml # Example configuration snippet demonstrating how certain settings can impact resource utilization. deepspeed: configs/ds_zero_3.json # Uncommenting may lead to out-of-memory errors despite lowering other parameters. ``` This indicates careful attention must be paid towards balancing computational resources against desired modifications intended for improving specific aspects of model behavior without exceeding available capacity limits imposed by physical hardware boundaries. #### Performance Benchmarks Against Competitors Comparatively speaking, earlier iterations within the same lineage have demonstrated superior capabilities across various evaluation metrics compared to contemporaries such as LLAMA2 variants[^2], suggesting continued advancements likely position newer releases favorably relative to existing alternatives currently present within similar categories based upon previous trends observed throughout development cycles up until now. --related questions-- 1. What are some best practices for optimizing the deployment process of Qwen2.5-1.5B-Instruct? 2. How does Qwen2.5-1.5B-Instruct perform in low-resource environments concerning inference speed versus accuracy trade-offs? 3. Can you provide examples where Qwen2.5-1.5B-Instruct excels particularly well over its predecessors? 4. Are there any known issues regarding compatibility between different versions of Qwen architectures used together in a single application stack?