基于亚马逊 Bedrock 的知识库检索器指南

最新推荐文章于 2025-11-25 12:24:36 发布

原创最新推荐文章于 2025-11-25 12:24:36 发布 · 195 阅读

CC 4.0 BY-SA版权

文章标签：

# 基于亚马逊 Bedrock 的知识库检索器指南

## 技术背景介绍

Amazon Bedrock 的知识库 (Knowledge Bases) 提供了一种简便的方法来构建基于检索增强生成 (RAG) 的应用程序。通过使用您的私有数据，您可以自定义基础模型的响应。这项服务简化了数据转换为嵌入向量、存储在向量数据库中、以及自定义集成以便搜索检索用户查询相关文本的繁琐过程。

在使用 Knowledge Bases for Amazon Bedrock 时，您只需指向 Amazon S3 中的数据位置，它会自动处理将数据上传至向量数据库的整个工作流程。如果没有现有的向量数据库，Bedrock 会为您创建一个 Amazon OpenSearch Serverless 向量存储。

## 核心原理解析

该服务的主要优势在于其自动化的数据处理和集成，您不需要手动管理嵌入向量，这极大地提高了效率和准确性。通过使用 Langchain - Amazon Bedrock 集成，您可以轻松使用检索 API 从知识库中检索相关结果。

## 代码实现演示

首先，我们需要安装必要的包：

```bash
%pip install -qU langchain-aws

接下来，我们可以实例化检索器来进行查询：

from langchain_aws.retrievers import AmazonKnowledgeBasesRetriever

# 实例化检索器，配置检索结果数
retriever = AmazonKnowledgeBasesRetriever(
    knowledge_base_id="PUIJP4EQUA",
    retrieval_config={"vectorSearchConfiguration": {"numberOfResults": 4}},
)

# 执行查询
query = "What did the president say about Ketanji Brown?"
results = retriever.invoke(query)
print(results)

使用链进行检索

要将检索器集成到更复杂的应用中，可以使用 RetrievalQA 链：

from botocore.client import Config
from langchain.chains import RetrievalQA
from langchain_aws import Bedrock

model_kwargs_claude = {"temperature": 0, "top_k": 10, "max_tokens_to_sample": 3000}

# 配置语言模型
llm = Bedrock(model_id="anthropic.claude-v2", model_kwargs=model_kwargs_claude)

# 创建检索QA链
qa = RetrievalQA.from_chain_type(
    llm=llm, retriever=retriever, return_source_documents=True
)

# 查询并获取结果
qa_results = qa(query)
print(qa_results)