深入探索 llama-cpp-python：在 LangChain 中启用本地 LLM 推理

最新推荐文章于 2025-03-30 18:00:14 发布

aehrutktrjk

最新推荐文章于 2025-03-30 18:00:14 发布

阅读量410

点赞数 3

文章标签： llama python langchain

本文链接：https://blog.youkuaiyun.com/aehrutktrjk/article/details/144130068

版权

引言

在人工智能的迅猛发展中，大语言模型(LLM)扮演着不可或缺的角色。Llama.cpp 是一个用于推理许多 LLM 模型的开源库，它的 Python 绑定——llama-cpp-python 提供了在 Python 中更加便捷的接口。这篇文章旨在介绍如何在 LangChain 中运行 llama-cpp-python，并探讨其安装和使用中的一些细节。

主要内容

1. 安装 llama-cpp-python

首先，我们需要选择合适的安装方式，具体取决于你的硬件配置：

CPU Only

%pip install --upgrade --quiet llama-cpp-python

GPU 支持 (使用 OpenBLAS / cuBLAS / CLBlast)

!CMAKE_ARGS="-DLLAMA_CUBLAS=on" FORCE_CMAKE=1 pip

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

aehrutktrjk

关注关注

3
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

LLM-项目详解-Chinese-LLaMA-AIpaca（二）：代码解读【①prompt指令制作、②合并分词器、③Lora模型与基础模型合并、③模型分片保存】

u013250861的博客

06-13

969

【代码】Chinese-LLaMA-AIpaca项目代码解读。

【LongChain-03】在本地运行LLM的另一些案例

gongdiwudu的专栏

02-05

3086

PrivateGPT、 llama.cpp和 GPT4All等项目的流行强调了在本地（在您自己的设备上）运行 LLM 的需求。这至少有两个重要的好处： Privacy：您的数据不会发送给第三方，并且不受商业服务的服务条款的约束 Cost：没有推理费用，这对于代币密集型应用程序很重要（例如，长时间运行的模拟、摘要）

参与评论您还未登录，请先登录后发表或查看评论

AI大模型时代，新手和程序员如何转型入局AI行业？

老皮的博客

07-19

575

在人工智能（AI）的浪潮中，大模型技术正以前所未有的速度发展，并在各个领域展现出其强大的应用潜力。

探索Llama.cpp：掌握llama-cpp-python的使用与安装

dsndnwfk的博客

10-31

932

通过本文的介绍，您应该掌握了Llama.cpp的安装与基本使用方法。希望这些知识可以帮助您在AI项目中获得一个良好的开端。LLM概念指南LangChain使用指南。

【Python3.12.9安装llama-cpp-python遇到编译报错问题解决】

最新发布

xrinosvip的博客

03-30

1059

python3.12.9编译llama-cpp-python问题

llama-cpp-python

AI工程化、开源分享、文档翻译、代码笔记

07-16

3670

一、关于 llama-cpp-python 二、安装安装配置支持的后端 Windows 笔记 MacOS笔记升级和重新安装三、高级API 1、简单示例 2、从 Hugging Face Hub 中提取模型 3、聊天完成 4、JSON和JSON模式 JSON模式 JSON Schema 模式 5、函数调用 6、多模态模型 7、Speculative Decoding 8、Embeddings 9、调整上下文窗口四、OpenAI兼容Web服务器 Web服务器功能五、Docker镜像六、低级API

llama-cpp-python 项目教程

gitblog_00245的博客

08-08

617

llama-cpp-python 项目教程项目地址:https://gitcode.com/gh_mirrors/ll/llama-cpp-python 1. 项目的目录结构及介绍 llama-cpp-python/ ├── llama_cpp/ │ ├── __init__.py │ ├── llama_cpp.py │ ├── llama_chat_format.py │ └...

Llama-CPP-Python 教程

gitblog_00184的博客

08-08

2055

Llama-CPP-Python 教程项目地址:https://gitcode.com/gh_mirrors/ll/llama-cpp-python 1. 项目介绍 Llama-CPP-Python 是一个 Python 封装库，用于访问 Llama C++ 库的功能。这个封装使得在 Python 环境中可以方便地利用 Llama 的功能，如文本处理和模型交互。该项目由 Andrei Betle...

使用llama-cpp-python制作api接口

zc1226的博客

07-17

1250

使用llama-cpp-python制作api接口，可以接入gradio当中。

使用 Llama.cpp 和 llama-cpp-python 快速部署本地 LLM 模型

hgSdaegva的博客

01-23

2035

是llama.cpp的 Python 绑定，旨在简化本地运行大语言模型的过程。它支持多种 LLM 模型，包括可以从获取的模型。

Python 绑定llama.cpp github页面

强化学习曾小健

08-12

566

因此，消息应仅包含聊天消息和/或为模型提供额外上下文的系统消息（例如：日期时间等）。非嵌入模型（例如为文本生成设计的模型）通常只返回标记级嵌入，每个序列中的每个标记一个。注意：如果您使用的是 Apple Silicon (M1) Mac，请确保已安装支持 arm64 架构的 Python 版本。使用特定于您的系统的编译器优化构建的。将来，我希望为常见平台提供预构建的二进制文件和轮子，我很乐意接受这方面的任何有用贡献。话虽如此，还是有一些通过发布版本提供的预先构建的二进制文件以及一些社区提供的轮子。

llama-cpp-python安装bug：error: subprocess-exited-。scikit-build-core 0.8.2 using CMake 3.28.3 (wheel)

集电极

03-05

7979

Building wheel for llama-cpp-python (pyproject.toml) ... error error: subprocess-exited-with-error × Building wheel for llama-cpp-python (pyproject.toml) did not run successfully. │ exit code: 1 ╰─> [325 lines of output] *** scikit-build-c

安装llama-cpp-python

weixin_45735391的博客

02-27

323

安装llama-cpp-python。

llama-cpp-python 程序 Pyinstaller 打包后运行报错（RuntimeError: Failed to load shared library ‘llama.dll‘）

夏树让的博客

05-20

1640

本人基于 llama-cpp-python 构建了一个领域知识问答程序，并通过 Pyinstaller 打包成一个包含.exe运行文件的文件夹。该.exe在本机和另外三台电脑上运行正常，但在另两台上报错：RuntimeError: Failed to load shared library 'llama.dll'

**LLAMA-CPP-PYTHON 安装与配置完全指南**

gitblog_09254的博客

09-13

6457

LLAMA-CPP-PYTHON 安装与配置完全指南 llama-cpp-python Python bindings for llama.cpp 项目地址: https://gitcode.com/gh_mirrors/ll/l...

llama.cpp使用

m0_61797126的博客

07-21

3497

由于该库在不断更新，请注意以官方库的说明为准。目前互联网上很多教程是基于之前的版本，而2024年6月12日后库更新了，修改了可执行文件名，导致网上很多教程使用的quantize、main、server等指令无法找到，在当前版本（截至2024年7月20日）这些指令分别被重命名为llama-quantize、llama-cli、llama-server。

Windows11(非WSL)安装Installing llama-cpp-python with GPU Support

我看故我听

02-18

3176

直接安装，只支持CPU。想支持GPU，麻烦一些。

通过llama-cpp-python web server 实现函数调用

weixin_42023184的博客

09-04

397

深入探索Llama.cpp：在LangChain中使用llama-cpp-python

dfvcbipanjr的博客

12-05

958

使用可以让开发者在本地部署LLMs，结合LangChain，可实现更强大的应用场景。对于感兴趣的开发者，建议访问LangChain官方文档和Llama.cpp的GitHub仓库了解更多信息。

llama-cpp

03-30

常见的安装方式是通过源码编译，因为llama.cpp需要构建本地代码。用户需要确保系统有必要的依赖，比如CMake、C++编译器等。可能还需要安装Python绑定，这样用户可以用Python来调用。要分步骤说明，从克隆仓库、安装...