使用llama.cpp量化大语言模型

最新推荐文章于 2025-04-14 15:30:44 发布

原创

最新推荐文章于 2025-04-14 15:30:44 发布

· 809 阅读

·

11

·

版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#llama #语言模型 #人工智能

llama.cpp github地址：GitHub - ggerganov/llama.cpp: LLM inference in C/C++

克隆地址并尝试build：

git clone https://github.com/ggerganov/llama.cpp
cd llama.cpp
make GGML_CUDA=1    #没有gpu的linux使用make命令代替这一行即可

安装依赖项：

python3 -m pip install -r requirements.txt

在之前的教程中，我们提到了unsloth微调的办法，那时候保存的模型直接为.safetensors格式的，所以我们要先将其转换为gguf FP16格式格式。

# 转换模型为ggml FP16格式（cd ./llama.cpp)

python convert-hf-to-gguf.py ./your_hf_model_file    --outfile ./mymodel/yourmodel.gguf --outtype f16

其中./your_hf_model_file为你的hf或者gguf格式的模型文件文件夹地址，llama.cpp还支持多种模型格式转换方法，可以去github项目地址自行查看，其中./mymodel/yourmodel.gguf是输出文件夹的地址和输出的gguf格式文件名称，记得一定要以.gguf结尾。

# 四位量化 (us

最低0.47元/天解锁文章

博客等级

码龄7年

7
原创

62
点赞

71
收藏

41
粉丝

关注

私信

热门文章

上一篇：: 深度学习常用的linux系统（Ubuntu）操作指令（持续更新~）

下一篇：: 使用Ollama配置本地微调的gguf模型文件

最新评论

⭐使用yolov10完成预训练模型测试！⭐
鹏RPZ: 你好，我在网页中上传示例进行目标检测的时候遇到了一个bug： File "/home/renpengzhen t/zhangpeilun/yolov10/ultralytics/data/augment.py", line 729,in callimg = cv2.resize(img,new unpad, interpolation=CV2.INTER LINEAR) cv2.error: 0pencV(4.9.0):-1:error:(-5:Bad argument)in function 'resize>overload resolution failed: -src is not a numpy array, neither a scalar Expected ptr<cv::UMat> for argument 'src' 麻烦博主帮忙看看怎么解决
使用unsloth本地微调开源大模型步骤
饺皮子: [code=python] --------------------------------------------------------------------------- NotImplementedError Traceback (most recent call last) Cell In[3], line 1 ----> 1 from unsloth import FastLanguageModel 2 import torch 4 max_seg_length = 2048 #文本最大长度 Choose any! We auto support RoPE Scaling internally! File ~/anaconda3/envs/unsloth_env/lib/python3.11/site-packages/unsloth/__init__.py:91 89 # First check if CUDA is available ie a NVIDIA GPU is seen 90 if not torch.cuda.is_available(): ---> 91 raise NotImplementedError("Unsloth: No NVIDIA GPU found? Unsloth currently only supports GPUs!") 93 # Fix Xformers performance issues since 0.0.25 94 import importlib.util NotImplementedError: Unsloth: No NVIDIA GPU found? Unsloth currently only supports GPUs! [/code] 这个问题也是版本问题吗我已经装了 cuda了版本也是和我的显卡对应的但是就是不好用
使用Ollama配置本地微调的gguf模型文件
ikinono: ‘配置’ 本地微调的大模型，当然是参数优化，动词搞清楚
使用Ollama配置本地微调的gguf模型文件
starxu123456: 你这和微调相关吗，这最多算是推理时的参数优化
在120枚外观相同的硬币中，有一枚是假币，并且已知假币与真币的重量不同，但不知道假币与真币相比较轻还是较重。可以通过一架天平来任意比较两组硬币，最坏情况下，能不能只比较5次就检测出这枚假币？
2301_78526987: 写的什么啊？到底能不能解决？

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。