如何在LangChain中使用PGVector扩展Postgres作为向量存储

最新推荐文章于 2025-09-11 02:41:00 发布

原创

最新推荐文章于 2025-09-11 02:41:00 发布 · 730 阅读

7 ·

CC 4.0 BY-SA版权

文章标签：

#langchain #python

技术背景介绍

在现代自然语言处理（NLP）应用中，向量存储（vectorstore）是一个关键组件，它可以有效地存储和检索文本向量。LangChain是一个强大的工具，它提供了一些优秀的向量存储抽象。在这篇文章中，我们将介绍如何使用 langchain_postgres 包，通过 Postgres 的 pgvector 扩展实现向量存储。

核心原理解析

pgvector 是一个为Postgres设计的扩展，它允许在数据库中存储和操作高维向量。这使得我们可以使用Postgres作为一个高效的向量存储后端。langchain_postgres 包提供了一种方法，通过使用Postgres和 pgvector 扩展来实现LangChain向量存储抽象。

代码实现演示(重点)

环境配置及容器启动

首先，安装需要的包：

pip install -qU langchain_postgres

使用以下命令启动一个带有 pgvector 扩展的Postgres容器：

%docker run --name pgvector-container -e POSTGRES_USER=langchain -e POSTGRES_PASSWORD=langchain -e POSTGRES_DB=langchain -p 6024:5432 -d pgvector/pgvector:pg16

配置和初始化

确保安装了 langchain_openai、langchain_huggingface、langchain_core 包：

pip install -qU langchain-openai
pip install -qU langchain-huggingface
pip install -qU langchain-core

然后，我们可以初始化连接和嵌入对象：

import openai
import getpass
from langchain_openai import OpenAIEmbeddings
from langchain_huggingface import HuggingFaceEmbeddings
from langchain_core.embeddings import FakeEmbeddings
from langchain_core.documents import Document
from langchain_po

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

qahaj

关注关注

5
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

[用LangChain和PGVector实现高效向量存储的实用指南]

ahdfwcevnhrtds的博客

10-16

472

PGVector为Postgres数据库提供了强大的向量存储能力，结合LangChain可以实现高效的AI应用开发。LangChain官方文档PGVector GitHub仓库。

Langchain教程 | langchain+OpenAI+PostgreSQL（PGVector）实现全链路教程，简单易懂入门

HRG520JN的博客

04-01

3770

在阅读本文前，建议要有一定的langchain基础，以及langchain中document loader和text spliter有相关的认知，不然会比较难理解文本内容。是一个开源向量相似性搜索Postgres它支持:- 精确和近似最近邻搜索- L2距离，内积和余弦距离。

参与评论您还未登录，请先登录后发表或查看评论

3秒响应！PGVector优化LangChain查询性能的实战指南

最新发布

gitblog_00571的博客

09-11

253

你是否遇到过这样的困境：基于LangChain开发的AI应用，在处理大规模向量数据时查询耗时高达数秒甚至超时？随着向量数据库规模增长，相似性搜索性能往往成为应用响应速度的瓶颈。本文将从索引策略、查询优化、数据结构三个维度，提供可立即落地的PGVector性能调优方案，帮助你将LangChain应用的查询延迟从秒级降至毫秒级。 ## 为什么选择PGVector？ PGVector作为Postgr...

LangChain + PostgreSQL 实现向量数据库与 RAG 搜索

weixin_43825008的博客

03-27

2053

通过本教程，你可以快速实现一个基于 LangChain 和 PostgreSQL 的 RAG 搜索系统，使用向量数据库存储并检索文档的嵌入数据。你可以根据实际需求进一步扩展和优化此系统，提升其查询能力和处理效率。

探索PGVector和LangChain：利用Postgres作为后端进行高效向量存储

mmlihaio的博客

11-15

547

利用PGVector和LangChain，可以高效实现基于向量的存储和查询，适合复杂AI应用场景。LangChain官方文档Postgres PGVector扩展文档。

构建LangChain应用程序的示例代码：11、构建一个能够查询Postgres数据库并运行Python代码来分析检索到的数据的代理

Hugo的博客

06-04

1027

现在我们准备定义我们的应用程序逻辑。核心元素是代理状态、节点和边。由于我们的代码解释器可以返回像base64编码的图像这样的结果，我们不想将它们传回模型，我们将创建一个自定义的工具消息，允许我们在不将它们传回模型的情况下传递原始工具输出。自定义的工具消息，允许我们传递原始工具输出（以及用于传回模型的字符串内容）。"""首先，我们将定义一个用于调用我们模型的节点。我们需要确保将我们的工具绑定到模型上，以便它知道要调用它们。

[迈向高效信息检索：使用LangChain-Postgres实现PGVector]

dghejrk的博客

12-06

674

PGVector结合LangChain-Postgres，为用户提供了实现高效信息检索的强大工具。API参考向量存储概念指南向量存储使用指南。

驾驭PGVector：在LangChain中使用Postgres向量数据库的指南

mmlihaio的博客

12-20

595

PGVector是一个强大且灵活的工具，适用于需要高效向量运算的应用场景。通过集成LangChain，你可以在语义搜索等任务中充分利用其能力。- 获取最新的源码和文档LangChain 文档- 了解更多关于集成的细节PostgreSQL 文档- 探索如何优化数据库性能。

探索PGVector：在LangChain中利用PostgreSQL进行高效向量存储

rtykjhg的博客

12-15

672

PGVector为在LangChain中处理向量数据提供了强大的支持。通过本文，您已经了解了如何安装、设置和使用PGVector进行向量存储和搜索。

使用PGVector实现LangChain的向量存储：全面指南

akhfuiigabv的博客

10-10

553

本文介绍了使用 PGVector 进行向量存储的基本方法及其设置步骤。PGVector API 参考向量存储概念指南如何指南：向量存储。

探索PGVector：在LangChain中轻松使用向量数据库

akhfuiigabv的博客

11-28

541

通过本次学习，您应该能够在LangChain中自信地使用PGVector进行向量数据的存储和检索。想要深入学习，您可以查阅PGVector官方文档，以及LangChain使用指南。这些资源将为您提供更详细的使用案例和技术说明。

使用PostgreSQL存储聊天记录：LangChain中的PostgresChatMessageHistory实现

ppoojjj的博客

09-08

1035

PostgreSQL（也称为Postgres）是一个功能强大的开源对象关系数据库系统。它以其可靠性、数据完整性和正确性而闻名，支持复杂查询和高并发。在聊天应用中使用PostgreSQL可以提供高效的数据存储和检索能力。使用PostgreSQL和LangChain的PostgresChatMessageHistory类可以轻松实现聊天历史记录的存储和管理。这种方法提供了可靠的数据持久化，支持复杂查询，并可以轻松扩展以满足大规模应用的需求。

（五）Langchain PGVector 补充智能客服匹配式问答

西风瘦马

06-05

4369

本项目实现原理如下图所示，过程包括加载文件 -> 读取文本 -> 文本分割 -> 文本向量化 -> 问句向量化 -> 在文本向量中匹配出与问句向量最相似的top k个 -> 匹配出的文本作为上下文和问题一起添加到prompt中 -> 提交给LLM生成回答。先让用户的问题，匹配问答中的问题（多问一答），相同的问题意图需要泛化，如果问题相识度满足一定的阈值，则返回问题对应的答案，如果不满足相关度阈值，则把问题提交给文档问答库（适合有一定的业务文档积累场景）作为兜底，同样的也需要满足一定的相关度top k。

使用PGVectorStore存储和检索向量数据

ppoojjj的博客

08-03

630

PGVectorStore是LLAMA项目中的一个组件，专门设计用于在PostgreSQL数据库中存储和操作向量数据。它提供了简单的接口，使得向量的存储和检索变得非常便捷。

LangChain+通义千问+AnalyticDB向量引擎保姆级教程

IT界那些事儿

10-12

6461

本文以构建AIGC落地应用ChatBot和构建AI Agent为例，从代码级别详细分享AI框架LangChain、阿里云通义大模型和AnalyticDB向量引擎的开发经验和最佳实践，给大家快速落地AIGC应用提供参考。

基于Azure OpenAI、Langchain实现企业内部数据向量化存储

hellopz的博客

10-25

885

我司的FinOps产品基于Azure OpenAI、PGVector提供企业私有智能助手解决方案。该解决方案包括私有知识库、私有智能客服、云专家和运维专家等功能，旨在为客户提供更快速、便捷的服务和支持。通过利用人工智能和自然语言处理技术，联蔚的FinOps产品能够帮助企业进行云消费的全生命周期管理，从而极大地节省云支出并提升效率。如果有云上财务管理、企业私有智能助手的需求，可以关注我们的微信公众号、详情查看联蔚盘云官网联系我们。联蔚荣获微软Azure OpenAI 合作伙伴 Level 300 认证。

langchain-postgres：构建高效对话历史的PostgreSQL解决方案

gitblog_00848的博客

03-30

429

langchain-postgres：构建高效对话历史的PostgreSQL解决方案项目介绍 langchain-postgres 是一个开源项目，它实现了 LangChain 核心抽象使用 PostgreSQL 数据库的功能。这个项目允许开发者在 PostgreSQL 数据库中持久化对话消息历史，便于构建基于文本的对话系统、聊天机器人等应用。langchain-postgres 采用了 MIT...

探索PGVector：基于Postgres的LangChain向量存储解决方案

mmlihaio的博客

12-20

382

PGVector是LangChain的一个库，采用Postgres作为底层存储，并使用pgvector扩展来实现向量存储。它支持多种嵌入向量生成器（如OpenAI、HuggingFace），并具有灵活的文档管理和查询功能。PGVector是一个强大的工具，可以有效地管理和查询向量数据。PGVector API参考LangChain官方文档。

LangChain × PGVector：手把手教你搭建智能向量数据库

举世誉之而不加劝，举世非之而不加沮，定乎内外之分，辩乎荣辱之境，斯已矣。

06-11

979

本文将展示如何使用 LangChain + PGVector 搭建智能向量数据库。

langchain4j PgVector

03-17

### 集成 LangChain4J 与 PgVector LangChain4J 是一种用于构建基于大模型的应用程序的框架，而PgVector是一种 PostgreSQL 扩展，允许存储和查询向量数据。以下是关于如何将两者集成的方法。 #### 安装依赖项为了实现两者的集成，首先需要安装必要的库： ```bash # 添加 Maven 或 Gradle 依赖项到项目中 <dependency> <groupId>io.langchain</groupId> <artifactId>langchain4j-data-pgvector</artifactId> <version>最新版本号</version> </dependency> ``` 如果使用的是Gradle，则可以这样配置： ```gradle implementation 'io.langchain:langchain4j-data-pgvector:最新版本号' ``` #### 数据库设置确保已启用 `pgvector` 扩展并创建相应的表结构来支持嵌入式向量存储[^1]。 ```sql -- 启用 pgvector 扩展 CREATE EXTENSION IF NOT EXISTS vector; -- 创建一个示例表以保存文档及其对应的向量表示形式 CREATE TABLE documents ( id SERIAL PRIMARY KEY, content TEXT NOT NULL, embedding VECTOR(1536) -- 假设我们使用的嵌入维度为1536 ); ``` #### 使用 LangChain4J 连接至 PgVector 下面是一个简单的例子展示如何通过 LangChain4J 将文本转换为嵌入并向数据库写入这些嵌入的数据。 ```java import io.langchain4j.data.embedding.Embedding; import io.langchain4j.data.document.Document; import io.langchain4j.data.vectorstore.pgvector.PgVectorStore; import java.util.List; public class Main { public static void main(String[] args) throws Exception { String connectionString = "jdbc:postgresql://localhost/mydb"; String user = "postgres"; String password = "password"; // 初始化 PgVectorStore 实例 try (var store = new PgVectorStore.Builder() .connectionString(connectionString) .username(user) .password(password) .tableName("documents") // 对应前面定义好的表名 .build()) { Document document = new Document( "The quick brown fox jumps over the lazy dog." ); Embedding embedding = generateEmbeddingFor(document); // 自己实现或者调用外部服务生成嵌入 // 存储文档以及其对应嵌入到数据库里 store.add(List.of(new Pair<>(document, embedding))); System.out.println("Document stored successfully!"); } } private static Embedding generateEmbeddingFor(Document doc){ // 此处省略具体逻辑，实际应用可能涉及调用 LLM API 获取嵌入值 double[] values = { /* ... */ }; // 替换为真实的浮点数组 return new Embedding(values); } } ``` 上述代码片段展示了基本流程：先初始化 `PgVectorStore` 并指定连接参数；接着准备要处理的内容对象（这里是单条记录），再计算该内容的相关嵌入表达最后存入库中[^2]。 #### 查询相似度当完成数据录入之后就可以执行近似最近邻搜索操作找出最接近目标输入语义含义的结果集了。 ```java // 构造待比较的新样本 Document queryDoc = new Document("What does it mean?"); Embedding queryEmb = generateEmbeddingFor(queryDoc); List<Pair<Document, Double>> results = store.findMostSimilar(queryEmb, topK=5); for(var pair : results){ System.out.printf("Score=%.4f Content=%s%n",pair.getSecond(),pair.getFirst().getContent()); } ``` 此部分演示了怎样利用先前建立起来的知识库去检索那些跟提问最为贴切的回答选项们[^3]。 ---