使用LLaMA-Factory进行模型量化

原创

已于 2024-11-05 13:38:20 修改 · 4.6k 阅读

CC 4.0 BY-SA版权

文章标签：

于 2024-11-04 16:26:26 首次发布

在这里插入图片描述

以下实验基于微调后模型进行量化。针对基座模型的直接量化，可以使用与部署中使用的数据类型紧密匹配的公开通用数据集作为校准数据集量化（任意数据集）该部分可以参考使用llm-compressor。

LLaMA-Factory 支持多种量化方法，包括:

使用GPTQ和AWQ等后训练量化方法对模型进行量化时，需要进行以下步骤：（即使直接使用AutoAWQ和AutoGPTQ对qwen进行量化都需要进行以下步骤）

以下是量化导出时使用的yaml文件以及其中的基础参数

### examples/merge_lora/llama3_gptq.yaml 
### model
model_name_or_path: meta

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

关注关注

05-09

7390

05-07

452

3 条评论您还未登录，请先登录后发表或查看评论

4 条评论

日天.. 2025.01.16
H=torch.linalg.cholesky(H) torch._C._LinAlgError: ltnalg.cholesky: The factortzatton could not be completed because the input is not positive-definite (the leading minor of order 1 is not positive-definite).这个报错什么原因
- 蛐蛐蛐回复日天.. 2025.03.08
  我也碰到了这个报错