LangChain从入门到实践——LangChain介绍，大模型入门到精通，收藏这篇就足够了！

原创于 2025-10-13 11:05:53 发布 · 580 阅读

CC 4.0 BY-SA版权

文章标签：

#langchain #prompt #人工智能 #embedding #llama #github #LLM

什么是 LangChain

LangChain 是一个基于 python 语言的模块化、可组合、面向开发者的开源框架，旨在简化基于大型语言模型的应用程序开发。它由 Harrison Chase 于 2022 年 10 月发起，迅速成为 GitHub 上增长最快的开源项目之一。

顾名思义，LangChain中的“Lang”是指language，即⼤语⾔模型，“Chain”即“链”，也就是将⼤模型与外部数据&各种组件连接成链，以此构建AI应⽤程序。

为什么需要LangChain

当ChatGPT、QwenLM、DeepSeek等大语言模型（LLM）横空出世时，开发者们立刻意识到：LLM不是终点，而是构建智能应用的“大脑”。但要让这个“大脑”真正解决实际问题，还需要解决三个关键痛点：

信息过时

LLM的知识截止于训练数据的时间节点（如GPT-4的训练数据截止到2023年），无法回答诸如“2024年最新AI论文内容”或“今天纽约股市收盘价”这样的问题。

无法动手

LLM虽然能生成自然语言，但它不能执行外部操作，比如调用API、计算数值、查询数据库、发送邮件等。它就像一个只会思考的“脑壳”，没有“手脚”。

记忆有限

LLM的上下文窗口（例如GPT-4最多支持32,768个tokens）限制了它处理长文本的能力，难以记住对话历史或文档细节。

因此，我们需要一个框架，将LLM的“大脑”与“感官（数据）”、“手脚（工具）”、“记忆（上下文）”连接起来，让它从“聊天机器人”升级为“能解决具体问题的助手”。

为什么不使用模型 API 开发

不使用LangChain，确实可以使用GPT 或GLM4 等模型的API进行开发。比如，搭建“智能体”（Agent）、问答系统、对话机器人等复杂的 LLM 应用。

但使用LangChain的好处有：

简化开发难度：更简单、更高效、效果更好
学习成本更低：不同模型的API不同，调用方式也有区别，切换模型时学习成本高。使用LangChain，可以以统一、规范的方式进行调用，有更好的移植性。
现成的链式组装：LangChain提供了一些现成的链式组装，用于完成特定的高级任务。让复杂的逻辑变得结构化、易组合、易扩展

LangChain 使用场景

作为一名运维工程师，可以用 LLM（大模型）+ 工具链 的方式构建「智能运维机器人」，帮你在已有监控、告警、日志、K8s 平台上实现自动诊断 + 智能决策。

项目方向	简要说明	可实现功能
智能告警分析助手	对接 Prometheus Alertmanager、Oncall 平台	分析当前活跃告警、聚合历史告警趋势、关联处理手册，自动建议处理方案、支持“告警认领”/“告警屏蔽” 等操作
日志智能检索助手	对接 ELK / Loki / VictoriaLogs	LLM自动生成日志查询语句、关联上下文日志事件、一键分析“异常原因”
Grafana 智能分析助手	对接 Grafana API	接收 PromQL / 指标表达式、生成趋势图、自动分析性能瓶颈
Kubernetes 智能巡检 / 故障定位助手	对接 kubectl、K8s API Server	自动检测Pod异常原因（ImagePullBackOff、CrashLoopBackOff等）、一键修复（重启Pod、删除Evicted等）
自愈自动化运维平台 (AIOps)	LangGraph 构建可控流程图	事件 → 诊断 → 人工确认 → 执行动作、形成闭环：检测-诊断-修复-验证
监控配置生成助手	自动生成PrometheusRule、Blackbox配置	根据自然语言生成监控项、自动生成PromQL和yaml配置
工单/变更智能处理机器人	对接内部ITSM系统（如Jira/禅道）	解析工单内容 → 推荐处理流程、生成执行脚本或kubectl命令

LangChain技术体系

LangChain技术体系主要包括以下模块：

核心库

langchain-core

功能：提供 LangChain 的核心抽象和基类，是其他模块的基础。
主要组件：

Runnable：LangChain 的核心执行接口，所有链、代理和工具都基于此抽象。
PromptTemplate：用于动态生成模型输入的模板，支持字符串和聊天消息格式。
OutputParser：解析语言模型的输出（如 JSON、列表、结构化数据）。
Callbacks：用于监控和调试执行过程，支持日志记录、性能分析等。

用途：定义通用的接口和工具，确保模块之间的兼容性和可扩展性。

langchain

功能：主包，包含核心功能模块，依赖 langchain-core。
主要子模块：

LLMs：与语言模型交互的接口（如 OpenAI、Hugging Face）。
Chat Models：专为对话场景优化的模型接口。
Memory：管理对话上下文的模块（如 ConversationBufferMemory）。
Chains：组合提示、模型和其他组件的工作流（如 LLMChain、RetrievalQA）。
Agents：动态决策和工具调用的模块。
Tools：外部工具接口（如搜索、计算器）。

用途：提供构建复杂应用的完整工具集，适合快速开发。

langchain-community

功能：社区贡献的扩展模块，包含大量第三方集成和工具。
主要内容：

向量存储：支持 Chroma、FAISS、Pinecone 等向量数据库。
文档加载器：支持从 PDF、CSV、网页等加载数据。
工具：如 Wikipedia、SerpAPI、Arxiv 等。
模型集成：支持 Hugging Face、Anthropic、Cohere 等模型。

用途：扩展 LangChain 的功能，适合需要特定集成或开源替代方案的场景。

语言模型集成库

LangChain 支持与多种语言模型和嵌入模型的集成，这些集成通常以单独的子包形式提供，需单独安装。以下是常见的模型集成库：

langchain-openai

功能：与 OpenAI 的 GPT 模型和嵌入模型（如 text-embedding-ada-002）交互。
用途：适合需要高性能模型的商业应用。

langchain-huggingface

功能：支持 Hugging Face 的开源模型和嵌入模型（如 SentenceTransformers）。
用途：适合本地部署或开源模型的场景

其他模型集成

langchain-cohere: 支持 Cohere 的嵌入和生成模型。
langchain-mistralai: 支持 Mistral AI 的模型。
langchain-google-genai: 支持 Google 的 Gemini 模型。

向量存储和检索库

LangChain 支持多种向量数据库，用于存储和检索文本的向量表示。这些库通常在 langchain-community 中，或以独立包形式提供。

langchain-chroma

功能：与 Chroma 向量数据库集成，支持高效的向量存储和检索。
用途：适合本地或小型应用的向量存储。

langchain-pinecone

功能：与 Pinecone 云向量数据库集成。
用途：适合大规模、分布式向量存储。

langchain-faiss

功能：与 FAISS（Facebook AI Similarity Search）集成，支持高效的本地向量搜索。
用途：适合高性能、本地化场景。

其他向量存储

Weaviate (langchain-weaviate): 支持云原生向量数据库。
Qdrant (langchain-qdrant): 高性能向量搜索。
Elasticsearch (langchain-elasticsearch): 结合 Elasticsearch 的搜索能力。

工具和外部服务集成

LangChain 提供了大量工具库，用于与外部服务交互。这些工具通常在 langchain-community 中，或者需要单独安装。

langchain-serpapi

功能：与 SerpAPI 集成，用于网页搜索。
用途：为代理提供实时搜索能力。

langchain-wikipedia

功能：查询 Wikipedia 的内容。
用途：快速获取百科知识。
安装：包含在 langchain-community。

其他工具

Arxiv：查询学术论文。
Wolfram Alpha：数学和科学计算。
Zapier：自动化工作流集成。

辅助库

LangChain 生态还包括一些辅助库，用于调试、部署和增强功能。

langsmith

功能：LangChain 官方的调试和监控平台，用于记录链和代理的执行细节。
用途：优化性能、分析模型行为。

langserve

功能：将 LangChain 应用部署为 REST API。
用途：快速上线 LangChain 应用。

langgraph

功能：构建基于图的工作流，适合复杂、有状态的应用程序。
用途：实现多步骤推理或循环任务。

文档加载和处理库

LangChain 提供多种文档加载器和文本处理工具，通常在 langchain-community 中。

文档加载器

PDF：PyPDF2, pdfplumber。
Web：BeautifulSoup, WebBaseLoader。
CSV/Excel：pandas。

文本分割器

功能：将长文本切分为适合模型处理的块。
类型：

CharacterTextSplitter：按字符数分割。
RecursiveCharacterTextSplitter：递归分割，保留语义。
TokenTextSplitter：按 token 数分割。

LangChain核心模块

LLM 大模型接口

LangChain 封装了不同模型的调用方式，它统一了各种模型的接口，切换不同模型变得轻松。

PromptTemplate提示词模板

大模型的输出质量在很大程度上取决于提示词（Prompt）的设计，在LangChain 把提示词封装成模板，支持变量动态替换，管理起来更清晰，能灵活控制 Prompt 内容，避免硬编码。

Chain链

Chain链是 LangChain 的核心思想之一，一个 Chain 就是将多个模块串起来完成一系列操作，Chain链可以将上一步操作的结果交给下一步进行执行，比如用提示词模板生成 Prompt，将渲染后的提示词交给大模型生成回答，再将大模型的回答将结果输出到控制台，Chain和Linux中的管道符十分类似，每一步的输出自动作为下一步输入，实现模块串联。

Memory记忆

在和大模型对话时，大模型本身并不具备有记忆历史对话的功能，但是在使用ChatGPT、DeepSeek等大模型时，发现它们在同一个会话内有“上下文记忆”的能力，这样能使对话更加连贯。

LangChain 也提供了类似的记忆功能。通过 memory，可以把用户的历史对话保存下来，使大模型拥有历史记忆的能力，如下示例，每一轮对话会从ConversationSummaryBufferMemory中读取历史对话，渲染到Prompt供大模型使用。

对话结束之后，会将对话内容保存到ConversationSummaryBufferMemory，如果历史记忆超过一定大小，为了节省和大模型之间调用的token消耗，会对历史记忆进行摘要提取、压缩之后再保存，这样大模型拥有了记忆功能。

MCP与工具调用

大语言模型本身是一种基于大量数据训练而成的人工智能，它本身是基于大量的数据为基础对结果进行预测，因此，大模型可能会出现给出1+1=3这种情况，大模型本身是不会“上网”，也不会算数的，因此，可以给大模型接入各种各样的工具如Google搜索、高德地图定位信息查询、图像生成等等。

那么大模型是怎么使用工具的呢？在现如今，很多的大模型都支持了工具调用，也就是将可用的工具信息列表在调用大模型时传递过去，这些信息包括工具的用途、参数说明等等，大模型会根据这些工具的作用确定调用哪些工具，并且根据参数的描述，来返回调用工具的参数。

最终将工具调用结果返回给大模型，完成用户交给的任务，整个过程中，大模型会根据任务判断是否调用工具，并组织执行，这个自动决策执行的过程，就是由 agent 完成的。

agent 会自己思考、分步骤执行，非常适合复杂任务处理，后续我们也会深入介绍如何通过 LangChain 创建一个完整的 agent，自动协调多个工具完成复杂任务。

对于那些不支持工具调用的大模型，也可以根据提示词将可选的工具和调用方法传递给大模型，但是大模型的预测有很强的不确定性，返回结果的准确率会显著下降。

RAG检索

在一些LLM的使用场景，需要使用一些特定的文档让LLM根据这些文档的内容进行回复，而这些特定的文档通常不在LLM的训练数据中，此时RAG检索就有用武之地。

在LangChain中，可以读取文档作为大模型的知识库，来进行增强搜索，LangChain封装各种类型的文档读取器，可以将读取文档得到的数据，通过LangChain文档分割器对文档进行分割，通过文本嵌入模型对文本进行向量化，将文本的向量信息保存到向量数据库。

当用户向AI发起提问时，在向量数据库中检索出与提问相关的文档，然后与用户问题一起发送给大模型，这个过程就叫做RAG（检索增强生成，Retrieval-Augmented Generation），RAG 能让大模型回答特定领域的问答变得更加精准、实时，避免出现幻觉。

想入门 AI 大模型却找不到清晰方向？备考大厂 AI 岗还在四处搜集零散资料？别再浪费时间啦！2025 年 AI 大模型全套学习资料已整理完毕，从学习路线到面试真题，从工具教程到行业报告，一站式覆盖你的所有需求，现在全部免费分享！

👇👇扫码免费领取全部内容👇👇

一、学习必备：100+本大模型电子书+26 份行业报告 + 600+ 套技术PPT，帮你看透 AI 趋势

想了解大模型的行业动态、商业落地案例？大模型电子书？这份资料帮你站在 “行业高度” 学 AI：

1. 100+本大模型方向电子书

在这里插入图片描述

2. 26 份行业研究报告：覆盖多领域实践与趋势

报告包含阿里、DeepSeek 等权威机构发布的核心内容，涵盖：

职业趋势：《AI + 职业趋势报告》《中国 AI 人才粮仓模型解析》；
商业落地：《生成式 AI 商业落地白皮书》《AI Agent 应用落地技术白皮书》；
领域细分：《AGI 在金融领域的应用报告》《AI GC 实践案例集》；
行业监测：《2024 年中国大模型季度监测报告》《2025 年中国技术市场发展趋势》。

3. 600+套技术大会 PPT：听行业大咖讲实战

PPT 整理自 2024-2025 年热门技术大会，包含百度、腾讯、字节等企业的一线实践：

在这里插入图片描述

安全方向：《端侧大模型的安全建设》《大模型驱动安全升级（腾讯代码安全实践）》；
产品与创新：《大模型产品如何创新与创收》《AI 时代的新范式：构建 AI 产品》；
多模态与 Agent：《Step-Video 开源模型（视频生成进展）》《Agentic RAG 的现在与未来》；
工程落地：《从原型到生产：AgentOps 加速字节 AI 应用落地》《智能代码助手 CodeFuse 的架构设计》。

二、求职必看：大厂 AI 岗面试 “弹药库”，300 + 真题 + 107 道面经直接抱走

想冲字节、腾讯、阿里、蔚来等大厂 AI 岗？这份面试资料帮你提前 “押题”，拒绝临场慌！

1. 107 道大厂面经：覆盖 Prompt、RAG、大模型应用工程师等热门岗位

面经整理自 2021-2025 年真实面试场景，包含 TPlink、字节、腾讯、蔚来、虾皮、中兴、科大讯飞、京东等企业的高频考题，每道题都附带思路解析：

2. 102 道 AI 大模型真题：直击大模型核心考点

针对大模型专属考题，从概念到实践全面覆盖，帮你理清底层逻辑：

3. 97 道 LLMs 真题：聚焦大型语言模型高频问题

专门拆解 LLMs 的核心痛点与解决方案，比如让很多人头疼的 “复读机问题”：

三、路线必明： AI 大模型学习路线图，1 张图理清核心内容

刚接触 AI 大模型，不知道该从哪学起？这份「AI大模型学习路线图」直接帮你划重点，不用再盲目摸索！

在这里插入图片描述

路线图涵盖 5 大核心板块，从基础到进阶层层递进：一步步带你从入门到进阶，从理论到实战。

L1阶段:启航篇丨极速破界AI新时代

L1阶段：了解大模型的基础知识，以及大模型在各个行业的应用和分析，学习理解大模型的核心原理、关键技术以及大模型应用场景。

L2阶段：攻坚篇丨RAG开发实战工坊

L2阶段：AI大模型RAG应用开发工程，主要学习RAG检索增强生成：包括Naive RAG、Advanced-RAG以及RAG性能评估，还有GraphRAG在内的多个RAG热门项目的分析。

L3阶段：跃迁篇丨Agent智能体架构设计

L3阶段：大模型Agent应用架构进阶实现，主要学习LangChain、 LIamaIndex框架，也会学习到AutoGPT、 MetaGPT等多Agent系统，打造Agent智能体。

L4阶段：精进篇丨模型微调与私有化部署

L4阶段：大模型的微调和私有化部署，更加深入的探讨Transformer架构，学习大模型的微调技术，利用DeepSpeed、Lamam Factory等工具快速进行模型微调，并通过Ollama、vLLM等推理部署框架，实现模型的快速部署。

L5阶段：专题集丨特训篇【录播课】

四、资料领取：全套内容免费抱走，学 AI 不用再找第二份

不管你是 0 基础想入门 AI 大模型，还是有基础想冲刺大厂、了解行业趋势，这份资料都能满足你！
现在只需按照提示操作，就能免费领取：

👇👇扫码免费领取全部内容👇👇

2025 年想抓住 AI 大模型的风口？别犹豫，这份免费资料就是你的 “起跑线”！

LangChain从入门到实践——LangChain介绍，大模型入门到精通，收藏这篇就足够了！

什么是 LangChain

为什么需要LangChain

信息过时

无法动手

记忆有限

为什么不使用模型 API 开发

LangChain 使用场景

LangChain技术体系

核心库

langchain-core

langchain

langchain-community

语言模型集成库

langchain-openai

langchain-huggingface

其他模型集成

向量存储和检索库

langchain-chroma

langchain-pinecone

langchain-faiss

其他向量存储

工具和外部服务集成

langchain-serpapi

langchain-wikipedia

其他工具

辅助库

langsmith

langserve

langgraph

文档加载和处理库

文档加载器

文本分割器

LangChain核心模块

LLM 大模型接口

PromptTemplate提示词模板

Chain链

Memory记忆

MCP与工具调用

RAG检索

一、学习必备：100+本大模型电子书+26 份行业报告 + 600+ 套技术PPT，帮你看透 AI 趋势

1. 100+本大模型方向电子书

2. 26 份行业研究报告：覆盖多领域实践与趋势

3. 600+套技术大会 PPT：听行业大咖讲实战

二、求职必看：大厂 AI 岗面试 “弹药库”，300 + 真题 + 107 道面经直接抱走

1. 107 道大厂面经：覆盖 Prompt、RAG、大模型应用工程师等热门岗位

2. 102 道 AI 大模型真题：直击大模型核心考点

3. 97 道 LLMs 真题：聚焦大型语言模型高频问题

三、路线必明： AI 大模型学习路线图，1 张图理清核心内容

路线图涵盖 5 大核心板块，从基础到进阶层层递进：一步步带你从入门到进阶，从理论到实战。

L1阶段:启航篇丨极速破界AI新时代

L2阶段：攻坚篇丨RAG开发实战工坊

L3阶段：跃迁篇丨Agent智能体架构设计

L4阶段：精进篇丨模型微调与私有化部署

L5阶段：专题集丨特训篇 【录播课】

四、资料领取：全套内容免费抱走，学 AI 不用再找第二份

L5阶段：专题集丨特训篇【录播课】