使用 Supabase 实现 RAG (检索增强生成)-优快云博客

本文链接：https://blog.youkuaiyun.com/tt_jishu/article/details/148719771

技术背景介绍

Supabase 是一个开源的 Firebase 替代方案，构建在 PostgreSQL 之上。它利用 pgvector 来在表格中存储嵌入向量，是处理向量数据的强大工具。通过将 OpenAI 的强大模型与 Supabase 的数据库功能结合，可以实现检索增强生成（RAG）应用。

核心原理解析

RAG 是一种将信息检索与生成模型相结合的方法，以提高生成内容的准确性和相关性。在这种模式下，我们首先通过向量搜索检索相关文档，然后使用生成模型生成新的内容。这种方法在处理大规模信息时非常有效，因为它能够利用数据库的搜索能力和生成模型的智能。

代码实现演示(重点)

我们将重点展示如何使用 Supabase 设置 RAG，并结合 OpenAI 的模型进行操作。

环境设置

首先，需要设置环境变量以访问 OpenAI 模型：

export SUPABASE_URL=https://your-supabase-url
export SUPABASE_SERVICE_KEY=your-service-key
export OPENAI_API_KEY=your-openai-api-key

数据库设置

在 Supabase 中，我们需要运行以下 SQL 脚本以启用 pgvector 并设置数据库：

-- 启用 pgvector 扩展以处理嵌入向量
create extension if not exists vector;

-- 创建一个表来存储文档
create table documents (
  id uuid primary key,
  content text, -- 对应于 Document.pageContent
  metadata jsonb, -- 对应于 Document.metadata
  embedding vector (1536) -- 1536 为 OpenAI 嵌入向量，按需更改
);

-- 创建一个用于搜索文档的函数
create function match_documents (
  query_embedding vector (1536),
  filter jsonb default '{}'
) returns table (
  id uuid,
  content text,
  metadata jsonb,
  similarity float
) language plpgsql as $$
#variable_conflict use_column
begin
  return query
  select
    id,
    content,
    metadata,
    1 - (documents.embedding <=> query_embedding) as similarity
  from documents
  where metadata @> filter
  order by documents.embedding <=> query_embedding;
end;
$$;

以上代码将设置数据库，使其能够存储和检索向量。

使用代码示例

接下来，安装 langchain-cli 并设置项目：

pip install -U langchain-cli

langchain app new my-app --package rag-supabase

在项目中使用 RAG：

from rag_supabase.chain import chain as rag_supabase_chain

# 添加路由以处理 RAG 请求
add_routes(app, rag_supabase_chain, path="/rag-supabase")

如果需要，可以配置 LangSmith 来帮助监控和调试应用：

export LANGCHAIN_TRACING_V2=true
export LANGCHAIN_API_KEY=<your-api-key>
export LANGCHAIN_PROJECT=<your-project>

启动服务：

langchain serve

服务将在本地运行，可以通过 http://localhost:8000/docs 查看所有模板。

应用场景分析

这种解决方案对于需要处理大量文档并生成相关内容的应用场景非常有用，比如问答系统、智能助手或者内容推荐系统。通过结合 Supabase 的数据检索能力和 OpenAI 的生成模型，可以显著提高系统的效率和响应质量。

实践建议

确保数据库结构符合应用需求，特别是嵌入向量的维度。
利用 LangSmith 进行调试和性能监控，以优化系统的响应时间。
定期更新和维护数据库，以确保检索结果的准确性。

如果遇到问题欢迎在评论区交流。

—END—