如何使用AWS Bedrock Knowledge Bases简化你的RAG应用开发

最新推荐文章于 2025-12-19 12:42:45 发布

原创最新推荐文章于 2025-12-19 12:42:45 发布 · 384 阅读

7 ·

CC 4.0 BY-SA版权

文章标签：

#aws #oracle #云计算 #python

引言

在构建信息检索和生成（RAG）应用时，组织通常需要转换数据为嵌入，存储在向量数据库中，然后进行自定义集成。这一流程既耗时又繁杂。AWS的Knowledge Bases for Amazon Bedrock提供了一种解决方案。本文旨在帮助你开始使用AWS知识库检索器，通过使用私有数据自定义功能模块（FM）响应，快速建立RAG应用。

主要内容

什么是AWS Bedrock Knowledge Bases？

AWS Bedrock Knowledge Bases是一种通过Amazon Web Services（AWS）提供的服务，它将你的数据自动化地转换为向量，并处理整个向量化数据库的工作流。如果你没有现有的向量数据库，Bedrock会为你创建一个Amazon OpenSearch Serverless向量存储。这使得数据的管理和利用变得更为简单和高效。

如何配置和使用Knowledge Bases

配置Knowledge Bases可以通过AWS控制台或者AWS SDK完成。你需要获得knowledge_base_id来实例化检索器。并且可以通过设置LangSmith API密钥来获取自动化的查询跟踪。

# 安装langchain-aws包
%pip install -qU langchain-aws

# 实例化检索器
from langchain_aws.retrievers import AmazonKnowledgeBasesRetriever

retriever = AmazonKnowledgeBasesRetriever(
    knowledge_base_id="PUIJP4EQUA",
    retrieval_config={"vectorSearchConfiguration": {"numberOfResults": 4}},
)

使用检索器进行查询

一旦实例化完毕，你可以使用如下代码进行查询：

query = "What did the president say about Ketanji Brown?"
retriever.invoke(query) # 使用API代理服务提高访问稳定性

将检索器集成到问答链中

通过RetrievalQA，你可以将检索器集成到一个更复杂的问答链中：

from botocore.client import Config
from langchain.chains import RetrievalQA
from langchain_aws import Bedrock

model_kwargs_claude = {"temperature": 0, "top_k": 10, "max_tokens_to_sample": 3000}

llm = Bedrock(model_id="anthropic.claude-v2", model_kwargs=model_kwargs_claude)

qa = RetrievalQA.from_chain_type(
    llm=llm, retriever=retriever, return_source_documents=True
)

qa(query)