LangChain 模型调用指南：理解 `invoke` 与 `_generate`

最新推荐文章于 2025-12-10 21:28:18 发布

原创最新推荐文章于 2025-12-10 21:28:18 发布 · 405 阅读

6 ·

CC 4.0 BY-SA版权

文章标签：

#langchain #python

python 同时被 2 个专栏收录

54 篇文章

订阅专栏

langchain

9 篇文章

订阅专栏

在 LangChain 中，与语言模型交互时，您会遇到 invoke 和 _generate 这两个关键方法。理解它们的区别和各自的角色对于有效使用和自定义 LangChain 模型至关重要。

核心思想：使用者 vs. 实现者

简单来说，这两个方法是为不同角色设计的：

invoke 是给 模型的使用者 调用的 公共 API。
_generate 是给 模型的开发者 实现的 内部核心逻辑。

`invoke` 方法 (公共 API / 使用者接口)

invoke 是 LangChain Expression Language (LCEL) 的一部分，是您与任何 LangChain 可运行对象（Runnable），包括语言模型、链（Chain）、检索器（Retriever）等进行交互的 标准、统一的入口。

特点：

统一接口：无论底层是 Gemini, OpenAI, Anthropic 还是一个复杂的处理链，您都使用 .invoke() 方法来调用它，这大大简化了代码的编写和维护。
可组合性：作为 LCEL 的核心，invoke 使得用 | 操作符将不同的组件（如提示模板、模型、输出解析器）像管道一样串联起来成为可能。
功能丰富：除了基本的调用，invoke 及其变体（ainvoke, stream, batch）还内置了对日志、回调、重试、流式输出、批处理等高级功能的支持。您无需在自己的代码中重复实现这些逻辑。

什么时候使用 `invoke`？

当您需要 调用一个已有的模型或链 来获取结果时，就应该使用 invoke。

示例（使用者视角）：

from langchain_google_genai import ChatGoogleGenerativeAI
from your_project.custom_gemini import CustomGeminiChatModel

# 使用官方提供的模型
llm_official = ChatGoogleGenerativeAI(model="gemini-pro")
response_official = llm_official.invoke("你好！") 
print(response_official.content)

# 使用我们自己创建的自定义模型
llm_custom = CustomGeminiChatModel()
response_custom = llm_custom.invoke("你好！")
print(response_custom.content)

注意，无论使用哪个模型，调用方式都是完全一样的。

`_generate` 方法 (内部实现 / 开发者接口)

_generate 是 BaseChatModel 类中的一个 内部抽象方法。它的命名以下划线 _ 开头，这在 Python 中是一个约定，表示它是一个受保护的（protected）或内部使用的方法，不应该被外部用户直接调用。

特点：

必须实现：当您想 创建自己的语言模型类（通过继承 BaseChatModel）时，您必须在您的子类中实现 _generate 方法（以及可选的异步版本 _agenerate）。
核心职责：它的职责非常纯粹，只做一件事——接收 LangChain 格式化好的消息列表 (List[BaseMessage])，然后直接调用目标模型（如 Google Gemini API）的底层 SDK，并将返回的结果包装成 LangChain 标准的 ChatResult 对象。
被框架调用：您自己从不直接调用 _generate。当用户调用 invoke 时，LangChain 框架会在内部调用您实现的 _generate 来完成最核心的模型请求部分。

什么时候实现 `_generate`？

当您需要 自定义一个 LangChain 不支持的模型，或者想在现有模型的基础上 增加额外的、底层的逻辑 时，就需要继承 BaseChatModel 并实现 _generate。

示例（开发者视角）：

# 在我们创建的 src/llm/custom_gemini.py 中
from langchain_core.language_models.chat_models import BaseChatModel
from langchain_core.outputs import ChatResult

class CustomGeminiChatModel(BaseChatModel):
    
    # ... 其他代码 ...

    def _generate(self, messages: List[BaseMessage], ...) -> ChatResult:
        # 1. 调用真正的 Gemini API SDK
        llm_result = self.client.generate([messages], ...)

        # 2. 将结果包装成 ChatResult
        generations = llm_result.generations[0]
        return ChatResult(generations=generations)