Llama factory微调后的模型怎么通过ollama发布

最新推荐文章于 2025-03-20 12:48:10 发布

蛐蛐蛐

最新推荐文章于 2025-03-20 12:48:10 发布

阅读量1k

点赞数 16

分类专栏：深度学习大模型科研工具文章标签： llama 大模型人工智能

本文链接：https://blog.youkuaiyun.com/qysh123/article/details/146139341

版权

接上一篇博客：用Llama Factory单机多卡微调Qwen2.5时报torch.OutOfMemoryError: CUDA out of memory的解决办法_llama-factory cuda out of memory-优快云博客

把Lora模块和其基模型merge到一起之后，就可以通过ollama之类的框架提供服务了。不过还是有些格式转换的工作要做：

首先

git clone https://github.com/ggerganov/llama.cpp

其次我们可以创建一个conda环境，然后运行：

pip install -r requirements.txt

这样就把llama.cpp的环境和依赖配置好了，我们注意到llama.cpp文件夹下有convert_hf_to_gguf.py之类的文件，实际上使用这种文件就可以了，例如我这里运行：

python convert_hf_to_gguf.py /home/quyu/Projects/LLaMA-Factory/models/qwen2.5-7b_lora_sft/ --outfile /home/quyu/qwen2.5_7b_finetuned.gguf

顾名思义，就是把huggingface类的文件转成g

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

蛐蛐蛐

关注关注

16
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

10、ollama启动LLama_Factory微调大模型（llama.cpp）

Andy_shenzl的博客

08-30

2954

在介绍了如何使用LLama_Factory微调大模型，并将微调后的模型文件合并导出，本节我们我们看下如何使用ollama进行调用。

LLaMA Factory添加新模型template的实战解析

herosunly的博客

07-29

17万+

本文主要介绍了LLaMA Factory添加新模型template的实战解析，希望对使用大语言模型的同学们有所帮助。文章目录 1. 前言 2. 实战解析 2.1 检查代码 2.2 修改代码

参与评论您还未登录，请先登录后发表或查看评论

ollama 使用自己的微调模型

spiderwower的博客

05-12

4万+

微调大模型的方法，这里不展开说，我使用的lora微调方法。微调大模型需要比较高的显存，推荐在云服务器上进行训练，系统环境为linux。

ollama导入自己微调后的模型胡言乱语

m0_57057282的博客

05-21

3247

原因：Modelfile的模板格式不对，对的如下所示。1.ollama导入自己微调后的模型胡言乱语。下载llama.cpp。

llama-factory微调deepseek，并导入ollama(包含遇到的问题）

m0_72204162的博客

03-19

536

home/cyl/test/train-deepseek-1.5b-gguf/model.guff是你转化为guff的存储路径。1、因为我们llam-factory输出的格式为.safetensors格式，需要先转换为guff格式。1、在/home/cyl/test/train-deepseek-1.5b-gguf路径下创建一个。/home/cyl/test/train-deepseek-1.5b是微调好的模型存储路径。注意：该指令需要进入llama.cpp根目录下执行，并且进入刚刚创建的环境中。

LlamaFactory-Ollama-Langchain大模型训练-部署一条龙

整天梦游的小jerry

06-06

2115

近些日子，大模型火的一塌糊涂，那么现在就有义务要学习一套好用的、从 dataset --> train --> deploy 的一整套流程，好拿来装逼。话不多说，进入正题。

Llama-Factory + Ollama 打造属于自己的中文版 Llama3

hyang1974的博客

05-05

9155

Meta Llama3发布已经有一小段时间了。和以往的原始 Llama 模型一样，Llama 3 对中文的支持效果欠佳。本文则探讨如何使用 Llama-Factory 对 Llama3 进行中文微调的具体过程，并通过 Ollama 本地部署中文微调的 Llama3 模型，打造属于自己的个性化的 Llama3 LLM 。

使用llama factory对语言模型微调，重塑自我认知，并部署于ollama上

qq_30173125的博客

07-11

1348

本文记录了从环境部署到模型、效果测试并部署的全过程。一环境如果使用autodl租赁服务器则不需要如下步骤，但是请注意llama_factory需要python、cuda等版本满足：首先请确报你已经安装好了conda工具，在命令行中键入如下指令创建虚拟环境创建后激活新环境安装cuda pytorch等核心工具如安装其他版本，请注意对应关系安装git-lfs然后验证是否安装成功，下载模型安装llama factory安装依赖启动webui通过该地址进入，autodl下载autodl ssh隧道工具。

使用LLaMA-Factory训练LLM大模型并用ollama调用

2401_84204413的博客

10-17

1438

创建E:\mypath文件夹，将其添加进用户环境变量Path中，之后会用。

LLama-factory大模型微调、ollama导入微调模型

qq_45672807的博客

09-11

715

Ubuntu下直接删除 ~/.config/dconf/user文件夹与 ~/.config/navicat文件夹。1.1 创建一个文本文件，并改名为模型名，扩展名为Modelfile。例如，llama3-8b.modelfile。合并后的模型格式为.safetensors，使用llama.cpp转换成gguf格式。1.2 用记事本编辑器打开文件，并添加内容。得到gguf格式后导入ollama。1、编码Modelfile文件。进入llama.cpp中。2、ollama创建模型。模型的微调、推理和合并。

LLaMA Factory多卡微调的实战教程

热门推荐

herosunly的博客

04-25

19万+

本文主要介绍了LLaMA Factory多卡微调的实战教程，希望对学习大语言模型的同学们有所帮助。文章目录 1. 前言 2. 配置环境 2.1 安装虚拟环境 2.2 安装依赖库 2.3 模型选型与下载 2.4 配置多卡环境 3. 运行代码 3.1 构建训练数据 3.2 修改配置文件 3.3 微调 3.3.1 zero3微调 3.3.2 启动API 3.3.3 模型测试

使用LLaMA-Factory训练LLM大模型并用ollama调用，一文教会你！！！

bugyinyin的博客

10-26

2417

需要Nvidia显卡，至少8G显存，且专用显存与共享显存之和大于20G 建议将非安装版的环境文件都放到非系统盘，方便重装或移植以Windows11为例，非安装环境文件都放在 E 盘下

Ollama安装使用与LLamaFactory微调模型（Windows）

JHZ056的博客

08-29

2642

Ollama 是一款开创性的人工智能（AI）和机器学习（ML）工具平台，它极大的简化了AI模型的开发和使用过程，Ollama出现的目的是为了解决AI模型的硬件配置和环境搭建的复杂问题：该工具的主要特点包括：（1）功能丰富，使用直观且高效。（2）对用户比较友好，上手无门槛。（3）推动AI普及，扩展AI能力。此外Ollama还会存在一系列的关键优势，它能自动识别并充分利用Windows系统中最优的硬件资源，可以实现针对性能优化，从而确保AI模型更加高效地运行；

自定义数据集使用llama_factory微调模型并导入ollama

weixin_53162188的博客

04-14

1万+

本文所有操作均在linux系统下完成。

llama factory学习笔记

weixin_41046245的博客

03-08

3542

这些命令行参数用于在单GPU上进行不同类型的模型训练，包括预训练、指令监督微调、奖励模型训练和PPO训练。首先配置accelerate,输入只有accelerate config，剩下的内容都是选项。这里我们看到llama factory的预训练也是基于lora进行预训练的。那么接下来我们尝试多卡进行 qwen/Qwen-14B lora 预训练。如果您使用多张 GPU 训练模型，请移步。您已经成功地为多GPU训练环境配置了。

安装LLaMA-Factory微调chatglm3，修改自我认知

caoyongsheng的博客

12-11

5194

安装git clone https://github.com/hiyouga/LLaMA-Factory.git。CUDA_VISIBLE_DEVICES=0 python src/train_web.py，按如下配置。

使用LLaMA Factory微调导出模型，并用ollama运行，用open webui使用该模型