深入掌握 LangChain：Part 2——模型组件详解，大模型入门到精通，收藏这篇就足够了！-优快云博客

在上一篇文章中，我已经介绍了 LangChain 的基本概念、核心价值以及六大核心组件的概况。本篇我将聚焦于其中最为关键的模型组件——这是实现与大语言模型交互的核心模块。将系统讲解该组件的工作原理、不同类型的模型及其适用场景，并演示如何根据实际需求进行灵活定制。

LangChain 模型组件结构图

LangChain 的模型组件类型

LangChain 的模型组件主要分为两大类：

• 语言模型（Language Models）：用于生成文本内容；
• 嵌入模型（Embedding Models）：将文本转换为向量表示，适用于语义搜索、相似度计算等任务。

语言模型可进一步分为：

• 大型语言模型（LLMs）：基于通用文本训练，适用于传统文本生成任务；
• 对话模型（Chat Models）：经过人类对话数据专门微调，更擅长交互式沟通，能更好地理解上下文、情感和语言细微差别。

目前，由于其在交互场景中的优异表现，对话模型已逐渐成为比传统 LLMs 更主流的选择。

LLMs 与 Chat Models 对比

LLMs 与 Chat Models 的区别

LLMs 和 Chat Models 行为差异图

LLMs 更侧重于单向的文本生成，而 Chat Models 专门为多轮对话优化，能够更自然地回应用户输入，维持对话上下文，适合需要连续交互的应用场景。

环境准备与依赖安装

在开始实验前，建议创建一个项目目录并在其中设置 Python 虚拟环境，然后安装以下依赖：

# LangChain 核心库
langchain
langchain-core

# OpenAI 接口
langchain-openai
openai

# Anthropic 接口
langchain-anthropic

# Google Gemini (PaLM) 接口
langchain-google-genai
google-generativeai

# Hugging Face 接口
langchain-huggingface
transformers
huggingface-hub

# 环境变量管理
python-dotenv

# 机器学习工具库
numpy
scikit-learn

建议将项目结构划分为三个文件夹，分别存放 LLMs、Chat Models 和 Embedding Models 相关的代码。

若使用付费 API（如 OpenAI、Google Gemini 或 Anthropic），需提前申请相应的 API 密钥。免费选项（如 Hugging Face 的某些模型）通常无需订阅，但可能有调用频率限制，不过基本功能均可正常使用。推荐将 API 密钥统一保存在项目根目录的 .env 文件中，便于管理且更安全：

# .env 文件示例

OPENAI_API_KEY = "你的密钥"
ANTHROPIC_API_KEY = " "
GOOGLE_API_KEY = " "
HUGGINGFACEHUB_ACCESS_TOKEN = " "

使用 LLMs（大型语言模型）

以下是一个调用 OpenAI 大型语言模型的代码示例：

from langchain_openai import OpenAI
from dotenv import load_dotenv

load_dotenv()  # 从 .env 加载 API 密钥

# 创建模型实例，指定使用的模型
llm = OpenAI(model='gpt-3.5-turbo-instruct')

# 通过 invoke 方法调用模型
result = llm.invoke("What is the capital of India")

print(result)

使用 Chat Models（对话模型）

对话模型的调用方式与 LLMs 类似，主要区别在于模型类型和输出结构：

from langchain_openai import ChatOpenAI
from dotenv import load_dotenv

load_dotenv()

model = ChatOpenAI(model='gpt-4')

result = model.invoke("What is the capital of India")

print(result.content)

需要注意的是，Chat Models 的输出对象不仅包含回答文本，还附带元数据信息，例如输入的提示词数量（prompt_tokens）、生成的 token 数量（completion_tokens）、使用模型名称（model_name）等。若只需最终答案，应提取 content 字段，这样可以避免输出不必要的元数据，直接获得如“The capital of India is New Delhi.”的清晰结果。

关键模型参数解析

temperature（温度）：该参数控制模型输出的随机性，可理解为“创造力”的调节钮。技术上，temperature 通过调整模型输出概率分布的平滑程度来影响结果多样性。

• 较低值（0–0.3，包含0）：输出确定性高、可预测，适合代码生成、数学计算等任务；
• 中间值（0.5–0.7）：平衡确定性和多样性，适用于一般问答和解释类任务；
• 较高值（0.9–1.2）：输出更加多样和创造性，适用于故事写作、诗歌生成等；
• 极高值（1.5+）：产生高度随机和发散性的结果，适合开放式头脑风暴。

max_completion_tokens（最大生成长度）：用于限制模型单次响应生成的 token 数量（大致相当于词数，但并非严格对应）。该参数尤其在使用付费 API 时非常重要，因为费用通常按输入和输出 token 总数计算。合理设置该参数既能控制成本，也能使输出更加简洁。

from langchain_openai import ChatOpenAI
from dotenv import load_dotenv

load_dotenv()

# 设置 temperature 为 1.5，并限制最大生成长度为 10 个 token
model = ChatOpenAI(model='gpt-4', temperature=1.5, max_completion_tokens=10)

result = model.invoke("Write a 5 line poem on cricket")

print(result.content)

多平台 API 调用示例

除 OpenAI 外，LangChain 还支持多种主流模型服务：

调用 Anthropic 模型：

from langchain_anthropic import ChatAnthropic
from dotenv import load_dotenv

load_dotenv()

model = ChatAnthropic(model='claude-3-5-sonnet-20241022')

result = model.invoke('What is the capital of India')

print(result.content)

调用 Google Gemini 模型：

from langchain_google_genai import ChatGoogleGenerativeAI
from dotenv import load_dotenv

load_dotenv()

model = ChatGoogleGenerativeAI(model='gemini-1.5-pro')

result = model.invoke('What is the capital of India')

print(result.content)

开源模型实践

开源模型示意图

图片来源：CampusX

若希望免费使用模型，可通过 Hugging Face 获取 API 密钥：

通过 Hugging Face API 在线调用模型：

from langchain_huggingface import ChatHuggingFace, HuggingFaceEndpoint
from dotenv import load_dotenv

load_dotenv()

llm = HuggingFaceEndpoint(
    repo_id="TinyLlama/TinyLlama-1.1B-Chat-v1.0",
    task="text-generation"
)

model = ChatHuggingFace(llm=llm)

result = model.invoke("What is the capital of India")

print(result.content)

本地加载 Hugging Face 模型：

from langchain_huggingface import ChatHuggingFace, HuggingFacePipeline

llm = HuggingFacePipeline.from_model_id(
    model_id='TinyLlama/TinyLlama-1.1B-Chat-v1.0',
    task='text-generation',
    pipeline_kwargs=dict(
        temperature=0.5,
        max_new_tokens=100
    )
)
model = ChatHuggingFace(llm=llm)

result = model.invoke("What is the capital of India")

print(result.content)

上述代码会先将模型下载到本地，然后进行推理。由于 CPU 并非为 LLM 推理而优化，处理大型模型时速度较慢，因此建议选择像 TinyLLaMA 这类参数量较小的轻量级模型，以减少内存占用并提升响应速度。如需在 CPU 上运行更大模型，可考虑使用模型量化技术或优化后的推理引擎。

嵌入模型实践

嵌入模型用于将文本转换为向量表示，适用于语义搜索、文本分类和情感分析等任务。获得文本的嵌入向量后，可以计算不同文本之间的相似度，从而找到相关内容。

单句嵌入示例：

from langchain_openai import OpenAIEmbeddings
from dotenv import load_dotenv

load_dotenv()

# 创建嵌入模型实例，指定模型和向量维度
embedding = OpenAIEmbeddings(model='text-embedding-3-large', dimensions=32)

result = embedding.embed_query("Delhi is the capital of India")

print(result)

多段文本嵌入示例：

from langchain_openai import OpenAIEmbeddings
from dotenv import load_dotenv

load_dotenv()

embedding = OpenAIEmbeddings(model='text-embedding-3-large', dimensions=32)

documents = [
    "Delhi is the capital of India",
    "Kolkata is the capital of West Bengal",
    "Paris is the capital of France"
]

result = embedding.embed_documents(documents)

print(result)

使用开源嵌入模型：

from langchain_huggingface import HuggingFaceEmbeddings

embedding = HuggingFaceEmbeddings(model_name='sentence-transformers/all-MiniLM-L6-v2')

documents = [
    "Delhi is the capital of India",
    "Kolkata is the capital of West Bengal",
    "Paris is the capital of France"
]

vector = embedding.embed_documents(documents)

print(vector)

本文详细介绍了 LangChain 的模型组件，系统介绍了语言模型（包括 LLMs 和 Chat Models）与嵌入模型的功能特点与区别。通过实际代码示例演示了如何集成多种模型服务（如 OpenAI、Anthropic、Google Gemini 和 Hugging Face），包括付费服务和免费开源选项。此外，还详细讲解了关键模型参数的作用和设置方法，并展示了如何使用嵌入模型处理单句和多段文本。

通过本文，你不仅理解了 LangChain 模型组件的核心概念，还掌握了实际应用的代码实现，可以立即开始构建自己的 AI 应用。无论是云端付费服务还是本地开源模型，都能灵活集成到你的项目中。

想入门 AI 大模型却找不到清晰方向？备考大厂 AI 岗还在四处搜集零散资料？

别再浪费时间啦！2025 年 AI 大模型全套学习资料已整理完毕，从学习路线到面试真题，从工具教程到行业报告，一站式覆盖你的所有需求，现在全部免费分享！

👇👇扫码免费领取全部内容👇👇