使用SurrealDB和Langchain实现实时数据库文档加载

最新推荐文章于 2025-11-13 05:49:57 发布

原创最新推荐文章于 2025-11-13 05:49:57 发布 · 340 阅读

5 ·

CC 4.0 BY-SA版权

文章标签：

#数据库 #langchain #oracle

技术背景介绍

SurrealDB是一种创新的云原生数据库，专为现代应用而设计，包括Web、移动、无服务器、Jamstack和传统应用等。它旨在简化数据库和API基础设施，减少开发时间，并以更低的成本构建安全高效的应用。SurrealDB的关键功能包括实时协作API后端服务、多语言查询支持，以及细粒度访问控制。

在这篇文章中，我们将重点介绍如何使用SurrealDBLoader来加载Langchain文档。

核心原理解析

SurrealDBLoader是一个工具，可以从SurrealDB数据库中返回一组Langchain文档。它通过WebSocket连接到数据库，并支持多种参数设置，包括命名空间、数据库名、表名以及用户凭证等。

代码实现演示

下面是一个使用SurrealDBLoader从数据库中加载文档的示例代码：

# 必须安装的库
# %pip install --upgrade --quiet surrealdb langchain langchain-community

# 解决Jupyter Notebook的异步问题
import nest_asyncio
nest_asyncio.apply()

import json
from langchain_community.document_loaders.surrealdb import SurrealDBLoader

# 设置SurrealDBLoader
loader = SurrealDBLoader(
    dburl="ws://localhost:8000/rpc",  # WebSocket连接
    ns="langchain",                   # 命名空间
    db="database",                    # 数据库名称
    table="documents",                # 表名称
    db_user="root",                   # 数据库用户
    db_pass="root",                   # 数据库密码
    filter_criteria={},               # 过滤条件
)

# 加载文档
docs = loader.load()
print(f"Loaded {len(docs)} documents.")

# 查看最后一份文档的元数据
doc = docs[-1]
print("Metadata:", doc.metadata)

# 查看文档内容的长度
print("Page content length:", len(doc.page_content))

# 解析页面内容
page_content = json.loads(doc.page_content)
print("Page content text:", page_content["text"])