使用谷歌云SQL服务器来存储、加载和删除Langchain文档

最新推荐文章于 2025-12-15 15:11:53 发布

原创最新推荐文章于 2025-12-15 15:11:53 发布 · 277 阅读

CC 4.0 BY-SA版权

文章标签：

对于现代应用程序的开发，尤其是在人工智能（AI）驱动的应用场景中，数据库是至关重要的基础设施之一。Google Cloud SQL 提供了一种全托管的关系数据库服务，支持多种数据库引擎，包括 MySQL、PostgreSQL 和 SQL Server。本文将重点介绍如何在 Google Cloud SQL for SQL Server 中使用 Langchain 的 MSSQLLoader 和 MSSQLDocumentSaver 来存储、加载和删除文档。

技术背景介绍

Google Cloud SQL 为开发者提供了高度可扩展的数据库服务，简化了数据库的管理和运维。通过与 Langchain 集成，开发者可以轻松管理和操作存储在 SQL Server 中的文档数据。

核心原理解析

在使用 Langchain 进行数据库操作时，我们主要使用以下类：

MSSQLEngine: 使用 SQLAlchemy 管理连接池，保证数据库连接的效率和稳定性。
MSSQLDocumentSaver: 提供文档的增删功能。
MSSQLLoader: 提供文档的加载功能，支持按需加载（lazy loading）和基于自定义查询的加载。

代码实现演示

以下代码展示了如何在 Google Cloud SQL 中配置 SQL Server 数据库并进行基本的文档操作。

# 导入必要的库
from langchain_google_cloud_sql_mssql import MSSQLEngine, MSSQLDocumentSaver, MSSQLLoader
from langchain_core.documents import Document

# 配置数据库连接参数
PROJECT_ID = "your-project-id"
REGION = "us-central1"
INSTANCE = "your-instance"
DATABASE = "your-database"
DB_USER = "your-db-user"
DB_PASS = "your-db-password"
TABLE_NAME = "default-table"

# 创建 MSSQL 引擎
engine = MSSQLEngine.from_instance(
    project_id=PROJECT_ID,
    region=REGION,
    instance=INSTANCE,
    database=DATABASE,
    user=DB_USER,
    password=DB_PASS,
)

# 初始化表
engine.init_document_table(TABLE_NAME, overwrite_existing=True)

# 保存文档
saver = MSSQLDocumentSaver(engine=engine, table_name=TABLE_NAME)
test_docs = [
    Document(page_content="Sample Content", metadata={"key": "value"}),
]
saver.add_documents(test_docs)

# 加载文档
loader = MSSQLLoader(engine=engine, table_name=TABLE_NAME)
docs = loader.lazy_load()
for doc in docs:
    print("Loaded document:", doc)

# 删除文档
saver.delete(test_docs)