大模型架构记录【综述-langchain】

原创

已于 2025-03-24 03:18:21 修改 · 582 阅读

2 ·

CC 4.0 BY-SA版权

文章标签：

#langchain

于 2025-03-15 02:29:44 首次发布

1 重点梳理：

langchain官网：Introduction | 🦜️🔗 LangChain

模板链接：LangSmith

storage：存储，翻译

chain = final_prompt | llm：在 LangChain 的上下文中，| 符号通常用于表示管道（Pipeline）操作，即将一个对象的输出传递给另一个对象的输入。这种用法类似于 Linux 中的管道操作，可以将多个处理步骤串联起来，形成一个完整的处理流程。

CommaSeparatedListOutputParser() 是 LangChain 中的一个实用工具，用于将语言模型生成的文本输出解析为一个由逗号分隔的列表。

LangChain概述：（overview）LangChain是一个开源框架，专为简化大语言模型（如GPT）应用的开发而设计。它通过模块化组件（如链式流程、智能代理）整合数据检索、模型调用与结果解析，帮助开发者高效构建问答系统、自动化工具等复杂应用，降低开发门槛并提升扩展性。

Prompt Template：（提示模板）提示模板用于规范模型输入格式，通过预设模板动态插入变量（如用户问题、上下文）。例如，将“问题”和“背景”嵌入固定句式，生成结构化的提示文本，确保输入一致性，减少重复代码，同时支持灵活的场景适配。

Models and Output Parsers（模型与输出解析器）

Models：支持多种模型类型，如通用大语言模型（LLMs）和对话模型（Chat Models），开发者可自由调用或切换不同模型（如GPT-3、Claude），满足多样化需求。
Output Parsers：将模型的非结构化文本输出（如回答、长文本）转换为结构化数据（如JSON、列表），便于提取关键信息（如日期、实体）并传递给下游程序，增强结果的可操作性。

Langchain的核心组件：

模型 I/O 封装：负责 标准化模型的输入输出流程，包括调用大语言模型（如GPT）、设计提示词模板（Prompt Template）规范化输入，以及解析模型输出（Output parser）为结构化数据，确保交互的灵活性和一致性。
Retrieval（检索）：支持 文档的加载、分割、向量化与存储，通过Embedding模型将文本转为向量，结合向量数据库实现高效语义检索，适用于知识库问答或信息增强场景。
Chain（链式流程）：将多个功能模块串联成自动化流程，例如“检索→生成提示→调用模型→解析结果”，简化复杂任务的编排与执行。
Agent（智能代理）：基于用户指令和可用工具（如搜索、计算），自主规划执行步骤（如先调用A工具，再处理结果），实现端到端 任务自动化，类似“AI调度员”。
记忆管理：通过 缓存对话历史或任务上下文，维持模型对长期交互的连贯性，例如记住用户偏好或前序步骤的中间结果。

2 什么是langchain

LangChain 是一个用于开发由大型语言模型（LLM）驱动的应用程序的开源框架。它提供了一套工具、组件和接口，简化了创建由 LLM 和聊天模型支持的应用程序的过程。LangChain 的核心目标是让开发者能够轻松地将 LLM 与外部数据源、API 和其他工具集成，从而构建出更智能、更实用的应用。