LangChain 核心概念与架构详解

最新推荐文章于 2025-05-16 20:24:15 发布

dgay_hua

最新推荐文章于 2025-05-16 20:24:15 发布

阅读量1.4k

点赞数 34

文章标签： langchain 架构 python

本文链接：https://blog.youkuaiyun.com/dgay_hua/article/details/145714657

版权

简介

LangChain 是一个强大的框架，专注于构建基于大语言模型 (LLM) 的应用。本文将深入介绍 LangChain 的核心架构、关键组件以及其特性。通过理解这些内容，开发者能更高效地构建复杂的 LLM 应用。

LangChain 架构解析

LangChain 的架构由多个包组成，每个包负责特定的功能模块。以下是主要组件的功能和作用：

1. 核心基础包 (`langchain-core`)

此包定义了 LangChain 的基础抽象，包括 LLMs、向量存储、检索器等核心组件的接口和组合方式。为了保持轻量级，它不涉及任何第三方集成。

2. 主包 (`langchain`)

主包提供了构建链式逻辑、智能代理 (agents) 及高级检索策略的核心模块。这些功能是通用的，与具体的第三方服务无关。

3. 社区集成包 (`langchain-community`)

这是一个第三方集成包，包含了 LangChain 社区维护的扩展和功能。其依赖是可选的，旨在保持包的轻量级。

4. 高级扩展包

langgraph: 通过节点和边的图模型，支持构建多参与者的复杂 LLM 应用程序。
langserve: 允许快速将 LangChain 构建的链部署为 REST API。
LangSmith: 提供用于调试、测试、评估和监控 LLM 应用的开发者平台。
LangChain Expression Language (LCEL): 提供声明式的组件组合方式，支持流式输出、异步调用以及配置重试与回退策略。

核心原理解析

LangChain 的核心原则围绕模块化与可扩展性，下面是其关键原理：

1. 模块化组件

LangChain 定义了一些关键组件，这些组件可以相互组合并轻松扩展：

Chat Models (对话模型): 接收消息序列输入并返回消息输出，支持多模态输入（如图像、语音）。
LLMs (语言模型): 传统的纯文本输入输出模型，通常用于解析较低层次的文本任务。
Prompt Templates (提示模板): 用于将用户输入转化为模型指令，灵活高效。
Retrievers (检索器): 负责从数据存储中检索文档，可与向量存储集成。
Output Parsers (输出解析器): 将模型的输出解析为结构化数据。
Vector Stores (向量存储): 存储嵌入向量并在查询时根据相似度返回结果。

2. LangChain Expression Language (LCEL)

LCEL 专注于构建灵活的链式逻辑，具有以下优点：

即时响应: 支持流式处理，减少延迟。
并行执行: 自动并行化独立步骤以优化性能。
回退机制: 提供重试和回退策略，提高可靠性。

代码实现演示

1. 使用 Chat 模型生成响应

以下代码展示如何通过 LangChain 使用对话模型生成响应：

from langchain_core.prompts import ChatPromptTemplate
from langchain_openai import ChatOpenAI

# 初始化 OpenAI 模型
model = ChatOpenAI(
    base_url="https://yunwu.ai/v1",  # 国内稳定访问
    api_key="your-api-key"
)

# 定义提示模板
prompt = ChatPromptTemplate.from_template("请给我讲一个关于{topic}的笑话")

# 生成响应
response = prompt | model
result = response.invoke({"topic": "猫"})
print(result)

注释：

使用了稳定可靠的 https://yunwu.ai 作为 API 入口。
提示模板通过 ChatPromptTemplate 定义。

2. 文档加载与分割

在 NLP 应用中，长文档通常需要分割为更小的块。以下代码展示了如何加载 CSV 数据并进行分割：

from langchain_community.document_loaders.csv_loader import CSVLoader
from langchain_text_splitters import RecursiveCharacterTextSplitter

# 加载 CSV 文档
loader = CSVLoader(file_path="data.csv")
documents = loader.load()

# 分割文档
splitter = RecursiveCharacterTextSplitter()
chunks = splitter.split_documents(documents)

print(f"文档分块数量: {len(chunks)}")

3. 构建带检索的问答系统

以下示例展示如何结合向量存储与检索器构建一个简单的问答系统：

from langchain.vectorstores import FAISS
from langchain.embeddings import OpenAIEmbeddings
from langchain.llms import OpenAI
from langchain.chains import RetrievalQA

# 初始化向量存储
vectorstore = FAISS.load("my_vector_index")
retriever = vectorstore.as_retriever()

# 初始化 LLM
llm = OpenAI(base_url="https://yunwu.ai/v1", api_key="your-api-key")

# 构建问答链
qa_chain = RetrievalQA(llm=llm, retriever=retriever)

# 提问
query = "如何优化大型数据库的查询性能？"
answer = qa_chain.run(query)
print(f"答案: {answer}")