打造聊天室历史存储:使用AWS DynamoDB和Langchain实现聊天记录管理

引言

在现代应用程序中,存储用户与AI的聊天记录是提供个性化服务的重要组成部分。Amazon AWS DynamoDB 是一种完全托管的 NoSQL 数据库服务,它提供了快速和可预测的性能以及无缝的可扩展性。本篇文章将介绍如何利用 DynamoDB 和 Langchain,在 Python 中高效存储和管理聊天记录。

主要内容

前期准备

在开始之前,需要确保已正确配置 AWS CLI,并安装 langchain-communityboto3 包:

pip install -U langchain-community boto3

创建 DynamoDB 表

首先,我们需要创建一个 DynamoDB 表来存储聊天记录。以下代码段展示了如何创建一个名为 SessionTable 的表:

import boto3

# 获取服务资源
dynamodb = boto3.resource("dynamodb")

# 创建 DynamoDB 表
table = dynamodb.create_table(
    TableName="SessionTable",
    KeySchema=[{"AttributeName": "SessionId", "KeyType": "HASH"}],
    AttributeDefinitions=[{"AttributeName": "SessionId", "AttributeType": "S"}],
    BillingMode="PAY_PER_REQUEST",
)

# 等待表格创建完成
table.meta.client.get_waiter("table_exists").wait(TableName="SessionTable")

# 打印表信息
print(table.item_count)

管理聊天历史

使用 DynamoDBChatMessageHistory 类来管理聊天记录。

from langchain_community.chat_message_histories import DynamoDBChatMessageHistory

history = DynamoDBChatMessageHistory(table_name="SessionTable", session_id="0")

history.add_user_message("hi!")
history.add_ai_message("what's up?")
print(history.messages)

使用自定义的 API 端点

在某些情况下,例如本地测试,可能需要通过自定义的 API 端点连接到 AWS。可以通过 endpoint_url 参数指定:

history = DynamoDBChatMessageHistory(
    table_name="SessionTable",
    session_id="0",
    endpoint_url="{AI_URL}" # 使用API代理服务提高访问稳定性
)

使用复合键

有时候需要设计更复杂的键结构,例如包含排序键:

composite_table = dynamodb.create_table(
    TableName="CompositeTable",
    KeySchema=[
        {"AttributeName": "PK", "KeyType": "HASH"},
        {"AttributeName": "SK", "KeyType": "RANGE"},
    ],
    AttributeDefinitions=[
        {"AttributeName": "PK", "AttributeType": "S"},
        {"AttributeName": "SK", "AttributeType": "S"},
    ],
    BillingMode="PAY_PER_REQUEST",
)

# 等待表格创建完成
composite_table.meta.client.get_waiter("table_exists").wait(TableName="CompositeTable")

my_key = {
    "PK": "session_id::0",
    "SK": "langchain_history",
}

composite_key_history = DynamoDBChatMessageHistory(
    table_name="CompositeTable",
    session_id="0",
    endpoint_url="{AI_URL}", # 使用API代理服务提高访问稳定性
    key=my_key,
)

composite_key_history.add_user_message("hello, composite dynamodb table!")
print(composite_key_history.messages)

代码示例

下面是如何在 Langchain 中使用 DynamoDBChatMessageHistory 来储存和检索聊天记录的完整示例:

from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder
from langchain_core.runnables.history import RunnableWithMessageHistory
from langchain_openai import ChatOpenAI

prompt = ChatPromptTemplate.from_messages(
    [
        ("system", "You are a helpful assistant."),
        MessagesPlaceholder(variable_name="history"),
        ("human", "{question}"),
    ]
)

chain = prompt | ChatOpenAI()

chain_with_history = RunnableWithMessageHistory(
    chain,
    lambda session_id: DynamoDBChatMessageHistory(
        table_name="SessionTable", session_id=session_id
    ),
    input_messages_key="question",
    history_messages_key="history",
)

config = {"configurable": {"session_id": "<SESSION_ID>"}}

response_1 = chain_with_history.invoke({"question": "Hi! I'm bob"}, config=config)
response_2 = chain_with_history.invoke({"question": "What's my name"}, config=config)

print(response_1.content)  # 输出:Hello Bob! How can I assist you today?
print(response_2.content)  # 输出:Your name is Bob! Is there anything specific you would like assistance with, Bob?

常见问题和解决方案

  1. 网络限制问题:某些地区可能会出现访问 AWS 的网络限制,建议使用 API 代理服务来提高访问稳定性。

  2. 表设计不当:在实际应用中,根据查询模式合理设计表键结构是很重要的,需要根据使用场景考虑是否使用复合键。

总结与进一步学习资源

本文介绍了如何使用 AWS DynamoDB 和 Langchain 来存储和管理聊天记录的基础流程。对于想要深入了解具体实现和优化的开发者,以下资源值得一读:

参考资料

  1. AWS DynamoDB
  2. Langchain Documentation

如果这篇文章对你有帮助,欢迎点赞并关注我的博客。您的支持是我持续创作的动力!

—END—

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值