llama-factory-0.7.0微调llama3-8B-Instruct-262k

原创

已于 2025-01-03 11:30:28 修改 · 1.6k 阅读

20 ·

CC 4.0 BY-SA版权

文章标签：

#llama

于 2024-06-05 17:19:41 首次发布

1.摘要

用llama-factory-0.7.0微调Llama-3-8B-Instruct-262k,微调数据是1.5k的论文审稿。

GPU配置是A40.

用llama-factory的0.7.1版本微调Llama-3-8B-Instruct-262k.

2.准备工作

2.1软硬件依赖

2.2 安装LLaMA-Factory

下载0.7.0版本

cd LLaMA-Factory

pip install –r requirements.txt

pip install -e .[metrics]

2.3 下载模型Llama-3-8B-Instruct-262k

https://huggingface.co/gradientai/Llama-3-8B-Instruct-262k

2.4 微调数据整理

数据文件：paper_review.json

微调数据文件paper_review.json中的数据格式：

{

"input_sys": "",

"instruction":""

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

mir2down2002

关注关注

18
点赞
踩
20

收藏

觉得还不错? 一键收藏
1
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

问题：Error RuntimeError: CUDA error: operation not supported when tried to locate something into CUDA

suiusoar

06-22

1417

Error RuntimeError: CUDA error: operation not supported when tried to locate something into CUDA

Llama3-8×8b-MoE github

强化学习曾小健

07-09

970

本项目基于Meta发布的进行开发。即将MLP复制8份做为8个专家，创建随机初始化的router，添加负载均衡损失，其余参数权重保持不变，搭建一个热启动的MoE模型。这种方式能够极大地降低从头开始训练一个MoE模型的成本，便于快速的在下游任务中微调使用。

1 条评论您还未登录，请先登录后发表或查看评论

1 条评论

m0_60721823 2024.06.06
写的真好，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】

部署llama3时出现RuntimeError: “triu_tril_cuda_template“ not implemented for ‘BFloat16‘报错

zwhszdx的博客

07-28

3594

部署llama3时出现RuntimeError: "triu_tril_cuda_template" not implemented for 'BFloat16'报错

llama3-8b-instruct-262k微调过程的问题笔记(场景为llama论文审稿)

鲨鱼儿的博客

05-25

1216

我使用longqlora zero3模型微调 llama3-8b-instruct-262k，开启了shift short attention + flash attention v2，训练的过程中一切正常，loss正常下降，使用的设备为 A6000 (48G)，占用的显存为30G左右，但在trainer保存模型时（模型 + zero3 优化器状态），显存的占用会出现短暂的暴涨为58G，模型保存后显存暂用恢复至30G左右。2. 验证集的验证方法选择什么样的方式来判断最佳模型。

llama-factory/peft微调千问1.5-7b-chat

qq_43814415的博客

05-02

4616

本文实现了llama-factory和自己基于peft进行qwen1.5-7b-chat的sft微调，评测。llama-factory兼容了很多加速方法，非常方便；自己写虽然慢，但是对底层的数据组织，处理认识更深。值得一提的是，LLM本质上还是一个分类预测任务，因此也采用CrossEntropyLoss，指数化后就是困惑度参考：1.2.3.4.5.6.7.8.9.

llama-factory 微调 Qwen2.5-3B-Instruct

coco的专栏

03-21

1242

官方 readme: https://github.com/hiyouga/LLaMA-Factory/blob/v0.9.1/README_zh.md官方文档: https://llamafactory.readthedocs.io/zh-cn/latest/官方推荐的知乎教程：https://zhuanlan.zhihu.com/p/695287607 笔者conda环境 Python 包如下：命令行输入：执行截图：关于数据集文件的格式，请参考 data/README_zh.md 的内

开源模型应用落地-用LLaMA-Factory点亮Qwen3-4B的“读心术”（十九）

最新发布

以微薄之力，予他人些许温暖.

08-13

1万+

利用LLaMA-Factory结合LoRA技术微调Qwen3-4B模型，在有限算力下通过精细化数据与训练设计，提升AI对用户意图的理解准确率。

基于 Llama-Index、Llama 3 和 Qdrant，构建一个 RAG 问答系统！

python122_的博客

07-21

898

RAG = 密集向量检索（R）+上下文学习（AG）检索：为您的文档中提出的问题查找参考资料。增强：将参考资料添加到您的提示中。生成：改进对所提出的问题的回答。在RAG中，我们通过将文本文档或文档片段的集合编码为称为向量嵌入的数值表示来处理它们。每个向量嵌入对应于一个单独的文档片段，并存储在一个称为向量存储的数据库中。负责将这些片段编码为嵌入的模型称为编码模型或双编码器。这些模型在广泛的数据集上进行了训练，使它们能够为文档片段创建强大的表示形式，即单个向量嵌入。

部署微调框架LLaMA-Factory

m0_67876774的博客

06-24

1894

1.我们在ChatGLM3的github官方页面上能看到对LLaMA-Factory的推荐。在Notebook中执行以下代码，拉取LLaMA-Factory项目到DSW实例。运行如下命令，如果显示llamafactory-cli的版本，则表示安装成功。，在工作空间列表页面中单击默认工作空间名称，进入对应工作空间内。在页面左上方，选择DSW实例所在的地域。安装LLaMA-Factory依赖环境。1.看到如下页面就已经部署成功。，进入DSW实例开发环境。页面中，单击快速开始区域。进入DSW开发环境。

Qwen2报错——RuntimeError: “triu_tril_cuda_template“ not implemented for ‘BFloat16‘

LiQZ的博客

08-13

7411

最近在使用 Qwen2-7B-Instruct 的时候报错 RuntimeError: “triu_tril_cuda_template” not implemented for ‘BFloat16’，尝试解决了几个星期终于解决了问题，以下是整体解决思路与方案。

解决RuntimeError: “triu_tril_cuda_template“ not implemented for ‘BFloat16‘

qq_44908396的博客

09-13

2650

qwen2-vl报错RuntimeError: "triu_tril_cuda_template" not implemented for 'BFloat16'，提供作者的解决方法

关于nn.upsample在GPU上无法兼容BFloat16的问题

tanhongweibest的博客

12-18

4060

，nn.upsample在GPU上运行时，与torch.bfloat16会发生冲突，常给出这样的错误：RuntimeError:"upsample_nearest2d_out_frame" not implemented for 'BFloat16'

加载Llama模型RuntimeError: “triu_tril_cuda_template“ not implemented for ‘BFloat16‘

Blue&boke

07-10

1890

在推理llama大模型时，原始代码如下，在加载model时，配置torch_dtype = ‘auto’

RuntimeError: “triu_tril_cuda_template“ not implemented for ‘BFloat16‘ 报错解决

instersight的博客

10-27

956

题主经过大量摸索，最终发现调整transformers包版本即可,题主4.37.2==>4.41.0后再运行就跑通了，如果不行可以从下面的版本多试几个（最好从前往后试）。

RuntimeError: “triu_tril_cuda_template“ not implemented for ‘BFloat16‘

m0_46371988的博客

07-23

1484

首先按照网上帖子，把自己模型的config.json里面的torch_dtype改成了float16，然后，错误还是出现。后来把transformer的版本改到了4.40.0 就能正常运行了。真的会被LLaMa-Factory这个错误给气死。后来发现是我安装的transfomer版本太低了。我的cuda是117，torch是1.13.0。

奇怪的错误记录

我的备忘录

07-11

1184

https://github.com/meta-llama/llama3/issues/80读模型没问题，推理时出现： RuntimeError: “triu_tril_cuda_template” not implemented for ‘BFloat16’————————————————我尝试了解transformers的AutoProcessor时，它提示我： RuntimeError: Failed to import transformers.models.auto.processing_auto

问题解决 |关于CUDA的代码错误总结以及解决方法

weixin_44649780的博客

06-26

1万+

本博客主要关于常见的CUDA的代码错误总结以及解决方法~

解决RuntimeError: CUDA error: device-side assert triggeredCUDA kernel errors...CUDA_LAUNCH_BLOCKING=1