使用PGVector实现强大的向量存储：从零开始构建你的LangChain与Postgres整合

最新推荐文章于 2025-09-11 09:48:36 发布

原创

最新推荐文章于 2025-09-11 09:48:36 发布 · 1.3k 阅读

6 ·

CC 4.0 BY-SA版权

文章标签：

#langchain #人工智能 #python

使用PGVector实现强大的向量存储：从零开始构建你的LangChain与Postgres整合

在现代机器学习应用中，向量存储（vector store）是用于处理和查询大规模文本数据的关键组件之一。本文将介绍如何使用PGVector，一个基于Postgres的向量存储实现，展示其如何集成到LangChain中，为开发复杂的AI应用提供解决方案。

引言

PGVector是LangChain推出的用于向量存储的抽象实现，它以Postgres数据库作为后端，并使用pgvector扩展以支持高效的向量操作。本文旨在帮助你了解如何设置和使用PGVector，并提供一个完整的代码示例来展示其在真实场景中的应用。

主要内容

1. PGVector包的设置

首先，你需要安装langchain_postgres包，该包提供了与Postgres的集成功能：

pip install -qU langchain_postgres

然后，我们可以使用Docker容器来运行一个包含pgvector扩展的Postgres实例：

docker run --name pgvector-container -e POSTGRES_USER=langchain -e POSTGRES_PASSWORD=langchain -e POSTGRES_DB=langchain -p 6024:5432 -d pgvector/pgvector:pg16

2. 向量存储的初始化

为了使用PGVector，你需要创建一个连接对象。请确保你的连接字符串使用psycopg：

connection = "postgresql+psycopg://langchain:langchain@localhost:6024/langchain"  # 使用API代理服务提高访问稳定性

在此过程中，我们可以选择使用不同的嵌入服务来为文本生成向量，例如OpenAI或HuggingFace。以下是一个使用OpenAI嵌入的示例：

from langchain_openai import OpenAIEmbeddings

embeddings = OpenAIEmbeddings(model="text-embedding-3-large")

3. 文档的添加和查询

一旦PGVector实例和连接成功配置，我们就可以向向量存储中添加文档：

from langchain_core.documents

最低0.47元/天解锁文章