[轻松迁移：升级至LCEL实现的详细指南]

最新推荐文章于 2025-12-20 09:26:15 发布

原创最新推荐文章于 2025-12-20 09:26:15 发布 · 539 阅读

6 ·

CC 4.0 BY-SA版权

文章标签：

#python #人工智能 #linux

轻松迁移：升级至LCEL实现的详细指南

在过去几年中，RetrievalQA链被广泛用于自然语言问答系统，在一个数据源之上执行检索增强生成（RAG）。然而，随着技术的进步，LCEL（LangChain Execution Layer）实现已经成为一个更为强大的选择。本文将详细讨论迁移至LCEL的优势及实现方法，提供实用指导和代码示例，帮助开发者快速上手。

迁移至LCEL的优势

更容易的定制化：LCEL提供了更灵活的定制选项，可以通过简单的参数调节配置提示词及文档格式。
更好地返回源文档：相比于传统的RetrievalQA链，LCEL更方便地返回用于回答问题的源文档。
支持可运行方法：LCEL支持流式处理和异步操作，这对于处理大规模或实时数据尤为重要。

LCEL与RetrievalQA的基本实现比较

在接下来的部分中，我们将使用相同的文档导入代码，将Lilain Weng关于自主代理的博客文章加载到本地向量存储中：

%pip install --upgrade --quiet langchain-community langchain langchain-openai faiss-cpu

import os
from getpass import getpass

os.environ["OPENAI_API_KEY"] = getpass()

# 加载文档
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain_community.document_loaders import WebBaseLoader
from langchain_community.vectorstores import FAISS
from langchain_openai.chat_models import ChatOpenAI
from langchain_openai.embeddings import OpenAIEmbeddings

loader = WebBaseLoader("https://lilianweng.github.io/posts/2023-06-23-agent/")
data = loader.load()

# 分割文档
text_splitter = RecursiveCharacterTextSplitter(chunk_size=500, chunk_overlap=0)
all_splits = text_splitter.split_documents(data)

# 存储分割
vectorstore = FAISS.from_documents(documents=all_splits, embedding=OpenAIEmbeddings())

# 初始化LLM
llm = ChatOpenAI()

使用RetrievalQA链

在使用传统的RetrievalQA链时，我们通常这样设置：

from langchain import hub
from langchain.chains import RetrievalQA

# 提示词配置
prompt = hub.pull("rlm/rag-prompt")

# 构建QA链
qa_chain = RetrievalQA.from_llm(
    llm, retriever=vectorstore.as_retriever(), prompt=prompt
)

response = qa_chain("What are autonomous agents?")

使用LCEL

LCEL实现允许我们更清晰地查看检索、格式化文档以及通过LLM进行处理的内部流程：

from langchain import hub
from langchain_core.output_parsers import StrOutputParser
from langchain_core.runnables import RunnablePassthrough

# 提示词配置
prompt = hub.pull("rlm/rag-prompt")

def format_docs(docs):
    return "\n\n".join(doc.page_content for doc in docs)

qa_chain = (
    {
        "context": vectorstore.as_retriever() | format_docs,
        "question": RunnablePassthrough(),
    }
    | prompt
    | llm
    | StrOutputParser()
)

response = qa_chain.invoke("What are autonomous agents?")