引言
在现代应用程序中,存储用户与AI的聊天记录是提供个性化服务的重要组成部分。Amazon AWS DynamoDB 是一种完全托管的 NoSQL 数据库服务,它提供了快速和可预测的性能以及无缝的可扩展性。本篇文章将介绍如何利用 DynamoDB 和 Langchain,在 Python 中高效存储和管理聊天记录。
主要内容
前期准备
在开始之前,需要确保已正确配置 AWS CLI,并安装 langchain-community
和 boto3
包:
pip install -U langchain-community boto3
创建 DynamoDB 表
首先,我们需要创建一个 DynamoDB 表来存储聊天记录。以下代码段展示了如何创建一个名为 SessionTable
的表:
import boto3
# 获取服务资源
dynamodb = boto3.resource("dynamodb")
# 创建 DynamoDB 表
table = dynamodb.create_table(
TableName="SessionTable",
KeySchema=[{"AttributeName": "SessionId", "KeyType": "HASH"}],
AttributeDefinitions=[{"AttributeName": "SessionId", "AttributeType": "S"}],
BillingMode="PAY_PER_REQUEST",
)
# 等待表格创建完成
table.meta.client.get_waiter("table_exists").wait(TableName="SessionTable")
# 打印表信息
print(table.item_count)
管理聊天历史
使用 DynamoDBChatMessageHistory
类来管理聊天记录。
from langchain_community.chat_message_histories import DynamoDBChatMessageHistory
history = DynamoDBChatMessageHistory(table_name="SessionTable", session_id="0")
history.add_user_message("hi!")
history.add_ai_message("what's up?")
print(history.messages)
使用自定义的 API 端点
在某些情况下,例如本地测试,可能需要通过自定义的 API 端点连接到 AWS。可以通过 endpoint_url
参数指定:
history = DynamoDBChatMessageHistory(
table_name="SessionTable",
session_id="0",
endpoint_url="{AI_URL}" # 使用API代理服务提高访问稳定性
)
使用复合键
有时候需要设计更复杂的键结构,例如包含排序键:
composite_table = dynamodb.create_table(
TableName="CompositeTable",
KeySchema=[
{"AttributeName": "PK", "KeyType": "HASH"},
{"AttributeName": "SK", "KeyType": "RANGE"},
],
AttributeDefinitions=[
{"AttributeName": "PK", "AttributeType": "S"},
{"AttributeName": "SK", "AttributeType": "S"},
],
BillingMode="PAY_PER_REQUEST",
)
# 等待表格创建完成
composite_table.meta.client.get_waiter("table_exists").wait(TableName="CompositeTable")
my_key = {
"PK": "session_id::0",
"SK": "langchain_history",
}
composite_key_history = DynamoDBChatMessageHistory(
table_name="CompositeTable",
session_id="0",
endpoint_url="{AI_URL}", # 使用API代理服务提高访问稳定性
key=my_key,
)
composite_key_history.add_user_message("hello, composite dynamodb table!")
print(composite_key_history.messages)
代码示例
下面是如何在 Langchain 中使用 DynamoDBChatMessageHistory
来储存和检索聊天记录的完整示例:
from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder
from langchain_core.runnables.history import RunnableWithMessageHistory
from langchain_openai import ChatOpenAI
prompt = ChatPromptTemplate.from_messages(
[
("system", "You are a helpful assistant."),
MessagesPlaceholder(variable_name="history"),
("human", "{question}"),
]
)
chain = prompt | ChatOpenAI()
chain_with_history = RunnableWithMessageHistory(
chain,
lambda session_id: DynamoDBChatMessageHistory(
table_name="SessionTable", session_id=session_id
),
input_messages_key="question",
history_messages_key="history",
)
config = {"configurable": {"session_id": "<SESSION_ID>"}}
response_1 = chain_with_history.invoke({"question": "Hi! I'm bob"}, config=config)
response_2 = chain_with_history.invoke({"question": "What's my name"}, config=config)
print(response_1.content) # 输出:Hello Bob! How can I assist you today?
print(response_2.content) # 输出:Your name is Bob! Is there anything specific you would like assistance with, Bob?
常见问题和解决方案
-
网络限制问题:某些地区可能会出现访问 AWS 的网络限制,建议使用 API 代理服务来提高访问稳定性。
-
表设计不当:在实际应用中,根据查询模式合理设计表键结构是很重要的,需要根据使用场景考虑是否使用复合键。
总结与进一步学习资源
本文介绍了如何使用 AWS DynamoDB 和 Langchain 来存储和管理聊天记录的基础流程。对于想要深入了解具体实现和优化的开发者,以下资源值得一读:
参考资料
如果这篇文章对你有帮助,欢迎点赞并关注我的博客。您的支持是我持续创作的动力!
—END—