使用Xinference和LangChain轻松部署本地大模型

最新推荐文章于 2025-03-24 15:38:24 发布

adfyvatbia

最新推荐文章于 2025-03-24 15:38:24 发布

阅读量775

点赞数 3

文章标签： langchain python

本文链接：https://blog.youkuaiyun.com/adfyvatbia/article/details/142732057

版权

# 使用Xinference和LangChain轻松部署本地大模型

## 引言
Xinference是一款强大且多功能的库，专为服务于大语言模型（LLMs）、语音识别模型以及多模态模型而设计。即使在笔记本电脑上，你也可以轻松运行这些复杂模型。本文旨在介绍如何使用Xinference与LangChain进行集成，并提供实用的代码示例。

## 主要内容

### Xinference的安装与部署

#### 1. 安装Xinference
首先，通过PyPI安装Xinference：

```bash
%pip install --upgrade --quiet "xinference[all]"

2. 部署Xinference

本地部署：直接运行xinference命令。
分布式集群部署：需要先启动Xinference的监督器（supervisor），默认端口为9997。可以使用-p选项指定端口，-H选项指定主机。

xinference-supervisor
xinference-worker  # 在每个服务器上运行

详细的配置和使用信息可以参考Xinference的README文件。

使用LangChain的Wrapper

为了使用LangChain处理Xinference&#x

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

adfyvatbia

关注关注

3
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

使用 Xinference 部署本地模型

洛阳泰山的博客

04-24

7698

是一款开源模型推理平台，除了支持 LLM，它还可以部署 Embedding 和 ReRank 模型，这在企业级 RAG 构建中非常关键。同时，Xinference 还提供 Function Calling 等高级功能。还支持分布式部署，也就是说，随着未来应用调用量的增长，它可以进行水平扩展。

【大模型】使用 Xinference 部署本地模型，从GPU服务器到本地知识库搭建Dify【LLM大语言模型（glm-4-9b-chat）、Rerank 模型、Embedding（向量）模型】

起而行动，方能平定心中的惶恐

09-04

1万+

本文会用到博主写的一些线上脚本，如果搭建者时纯内网的话，可能需要手动压缩镜像，然后解压镜像，才能正常部署本文从GPU服务器获取、到 nvidia-docker的安装、再到Xinference 部署私有化三个模型，最后搭建dify（供从 Agent 构建到 AI workflow 编排、RAG 检索、模型管理等能力，轻松构建和运营生成式 AI 原生应用）、最后再配置实例dify，配置dify实例，整合三个模型，最后实现知识库搭建。

参与评论您还未登录，请先登录后发表或查看评论

使用Xinference嵌入在LangChain中的应用

dgay_hua的博客

03-23

303

嵌入是将文字转换为向量的一种技术，使得计算机可以以一种数学可操作的方式理解自然语言。Xinference提供了一种高效、可扩展的嵌入服务，可以在本地或分布式集群中部署，适应不同的计算需求。

kubernetes环境xinference集群化部署

qq_41374319的博客

11-11

1796

默认情况下N-gpu处填充的是auto，我们在实际使用中需要根据模型规模评估显存大小，确认使用的gpu数量，一般情况下，模型所需的显存大小为模型规模*2.5。需要注意的是：supervisor和worker是有启动的先后顺序的，需要先启动supervisor然后再启动worker节点。xinference 14版本之后，可以根据内置的model family直接启动模型。# worker的metrics端口是可以通过命令自定义的。选择模型的属性即可启动模型，需要注意的是。可以使用一下yaml文件通过。

无错误！xinference部署本地模型glm4-9b-chat、bge-large-zh-v1.5

zbc的博客

06-27

1万+

使用xinference部署大语言模型 glm4-9b-chat、embedding模型 bge-large-zh-v1.5

本地部署知识库——大模型框架xinference的本地架设

lxszyj的博客

06-27

5688

断断续续也研究了1个来月了，期间还遭遇了docker被ban的惨剧，导致我一个新手要开始学习这种繁琐的本地开发步骤，目前还未感受到这样做的优点，但是看很多技术大佬都是这样做的，相信有它的道理吧。这一系列陆续会涉及以下内容：1.大模型框架xinference的本地架设2.知识库管理软件fastgpt、dify、maxkb、langchain chatchat、ragflow的架设和使用3.各类大模型的尝试（主要是笔记本性能有限，只能不断尝试最适合自己的）

在本地运行大模型：使用Xinference与LangChain无缝集成

cgsayuclv的博客

12-05

2111

Xinference提供了在本地设备上运行大型AI模型的可能性，同时与LangChain的无缝集成使得模型的调用与管理变得更加便捷。Xinference官方文档LangChain官方指南。

解锁本地AI推理的潜力：使用Xinference和LangChain整合大语言模型

nseejrukjhad的博客

09-20

541

Xinference与LangChain的结合，提供了一种高效的方式在本地或集群中运行复杂模型。LangChain官方文档。

[解锁强大的模型推理：使用Xinference与LangChain的结合]

fadbahgd的博客

12-08

1021

Xinference为模型推理提供了灵活而强大的工具，加上LangChain的结合，可以极大简化LLM和多模态模型的集成过程。LangChain文档Xinference GitHub页面。

[利用Xinference与LangChain实现强大的模型推理]

sjufgwgfhoia的博客

11-10

791

通过本文，您应该对如何使用Xinference与LangChain进行模型推理有了基本的了解。Xinference的强大之处在于其对于本地环境的友好支持以及在分布式场景中的高效部署。Xinference官方文档LangChain使用教程。

盘点8类AI大模型：对话和语言处理、视频、图像、数字人、搜索、语音、音乐....

m0_56255097的博客

07-22

3494

AI大模型作为人工智能领域的重要技术突破，正成为推动各行各业创新和转型的关键力量。抓住AI大模型的风口，掌握AI大模型的知识和技能将变得越来越重要。学习AI大模型是一个系统的过程，需要从基础开始，逐步深入到更高级的技术。这里给大家精心整理了一份全面的AI大模型学习资源，包括：AI大模型全套学习路线图（从入门到实战）、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频，免费分享！

本地部署开源大模型的完整教程：LangChain + Streamlit+ Llama

deephub

06-26

1万+

通过LangChain和Streamlit我们可以方便的整合任何的LLM模型，并且通过GGML我们可以将大模型运行在消费级的硬件中，这对我们个人研究来说使非常有帮助的。作者：Afaque Umer。

使用Xorbits Inference进行本地大模型部署及查询

ppoojjj的博客

07-07

1437

在本文中，我们将展示如何使用Xorbits Inference (简称Xinference) 在本地部署大型语言模型（LLM）。我们将使用Llama 2聊天模型作为示例，但代码适用于所有支持的LLM聊天模型。安装Xinference启动本地模型索引数据并进行查询。

DeepSeek本地化部署实践：Xinference框架+OpenWebUI实现DeepSeek-r1推理跑在国产GPU之上