使用 Supabase 和 pgvector 构建自查询向量检索器

最新推荐文章于 2025-12-09 16:47:37 发布

原创

最新推荐文章于 2025-12-09 16:47:37 发布 · 591 阅读

6 ·

CC 4.0 BY-SA版权

文章标签：

#python

在今天的文章中，我们将探讨如何使用 Supabase 和 PostgreSQL 的 pgvector 扩展构建一个自查询向量检索器。这种方式允许我们高效地存储、索引和查询向量嵌入，为构建 AI 应用程序提供了极大的便利。

技术背景介绍

Supabase 是一个开源的 Firebase 替代方案，基于 PostgreSQL 构建，提供强大的 SQL 查询能力以及简单的接口来与现有工具和框架集成。pgvector 是用于处理嵌入向量的 PostgreSQL 扩展，它使得在数据库中处理向量数据变得简单而高效。

核心原理解析

通过利用 pgvector 扩展，我们可以在 PostgreSQL 数据库中创建一个存储和检索文档的向量存储。Supabase 提供的工具让我们能够轻松管理这些功能。我们的目标是建立一个自查询的检索器，通过 LLM（大语言模型）和向量检索技术结合实现复杂的查询需求。

代码实现演示

以下是构建和测试一个自查询向量检索器的完整步骤：

创建 Supabase 数据库

首先，前往 Supabase 创建你的数据库。在 SQL 编辑器中运行以下脚本以启用 pgvector 并设置数据库：

-- Enable the pgvector extension to work with embedding vectors
create extension if not exists vector;

-- Create a table to store your documents
create table
  documents (
    id uuid primary key,
    content text, -- corresponds to Document.pageContent
    metadata jsonb, -- corresponds to Document.metadata
    embedding vector (1536) -- 1536 works for OpenAI embeddings, change if needed
  );

-- Create a function to search for documents
create function match_documents (
  query_embedding vector (1536),
  filter jsonb

最低0.47元/天解锁文章