从RetrievalQA迁移到LCEL的详细实践指南

最新推荐文章于 2025-12-07 20:52:38 发布

原创最新推荐文章于 2025-12-07 20:52:38 发布 · 409 阅读

9 ·

CC 4.0 BY-SA版权

文章标签：

#运维

随着自然语言处理技术的飞速发展，越来越多的开发者开始采用更灵活和易于定制的解决方案来增强他们的问答系统。在本文中，我们将详细探讨从传统的RetrievalQA迁移到LCEL实现方案的步骤以及相应的代码演示。

技术背景介绍

RetrievalQA是一种结合检索增强生成的自然语言问答解决方案，通过外部数据源进行推理和回答。虽然这种方法在一定程度上提供了可定制性，但在某些细节上，比如提示词和文档格式的配置，仍然受到限制。LCEL，则提供了更高的可定制性和更强大的功能，比如异步操作和流式处理。

核心原理解析

LCEL通过暴露检索、格式化文档以及提示词与LLM（大语言模型）之间的交互，赋予开发者更高的灵活性。它允许用户定制文档的格式和检索方式，从而增强问答系统的响应速度和准确性。

代码实现演示(重点)

首先，我们来看看如何使用LCEL实现一个简单的问答系统。以下代码展示了如何加载文档，将其分块存储到向量库，并结合LLM创建问答链。

安装所需库：

%pip install --upgrade --quiet langchain-community langchain langchain-openai faiss-cpu

进行文档加载和处理：

import os
from getpass import getpass

os.environ["OPENAI_API_KEY"] = getpass()

# 导入所需模块
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain_community.document_loaders import WebBaseLoader
from langchain_community.vectorstores import FAISS
from langchain_openai.chat_models import ChatOpenAI
from langchain_openai.embeddings import OpenAIEmbeddings

# 加载并分块处理文档
loader = WebBaseLoader("https://lilianweng.github.io/posts/2023-06-23-agent/")
data = loader.load()

text_splitter = RecursiveCharacterTextSplitter(chunk_size=500, chunk_overlap=0)
all_splits = text_splitter.split_documents(data)

# 存储分块到向量库
vectorstore = FAISS.from_documents(documents=all_splits, embedding=OpenAIEmbeddings())

# 初始化LLM
llm = ChatOpenAI()

创建LCEL问答链并执行：

from langchain_core.output_parsers import StrOutputParser
from langchain_core.runnables import RunnablePassthrough
from langchain import hub

# 获取提示模板
prompt = hub.pull("rlm/rag-prompt")

def format_docs(docs):
    return "\n\n".join(doc.page_content for doc in docs)

# 创建问答链
qa_chain = (
    {
        "context": vectorstore.as_retriever() | format_docs,
        "question": RunnablePassthrough(),
    }
    | prompt
    | llm
    | StrOutputParser()
)

result = qa_chain.invoke("What are autonomous agents?")
print(result)