LangChain+Ollama构建支持多轮对话的聊天机器人

最新推荐文章于 2025-11-26 15:49:07 发布

原创最新推荐文章于 2025-11-26 15:49:07 发布 · 908 阅读

11 ·

CC 4.0 BY-SA版权

文章标签：

#langchain #人工智能 #embedding #RAG #自然语言处理 #机器人 #ollama

本文将深入探讨如何使用 FastAPI、LangChain 和 Ollama 来构建一个 支持多轮对话 的智能聊天机器人。

通过本文，你将学会：

1. 如何利用 LangChain 和 FastAPI 进行 API 设计。
2. 如何使用 会话管理 来支持多轮对话。
3. 如何优化聊天机器人的 提示模板 以提升响应质量。

环境搭建

在开始实际编码之前，首先需要搭建一个干净、稳定的开发环境。本文推荐使用 conda 管理虚拟环境，并利用 pip 安装所需的依赖包。以下将详细介绍如何创建环境并安装相关依赖。

创建开发环境

使用 conda 创建一个独立的虚拟环境，可以确保项目间依赖不会相互干扰。执行以下命令，即可创建名为 langchain-api 的 Python 3.10 环境：

bin/conda create -n langchain-api python=3.10

这条命令会自动下载并安装 Python 3.10，同时为该环境配置基本的包管理工具。使用虚拟环境不仅有助于依赖的隔离，还能在需要时轻松切换不同版本的 Python 环境，适应各种项目需求。

在创建环境后，记得激活该环境：

conda activate langchain-api

安装依赖包

在环境搭建好后，我们需要安装实现 API 所需的各个依赖包。本文主要涉及以下几个核心组件：

• langserve：用于将 LangChain 链封装为 API 路由，便于与 FastAPI 集成。
• langchain：核心链式处理框架，负责提示模板、模型调用等功能。
• langchain_community：社区扩展包，提供了与 Ollama 大语言模型交互的接口。
• FastAPI：轻量级、高性能的 Web 框架，用于构建 API 服务。

pip install "langserve[all]"
pip install langchain
pip install langchain_community
pip install fastapi

实现原理与代码详解

在完成环境搭建之后，接下来的重点工作便是构建 API 服务。本文将结合代码示例，详细介绍如何利用 LangChain 与 Ollama 模型进行交互，并将整个流程封装为一个 API 接口。

环境依赖导入与模型初始化

import os
from fastapi import FastAPI
from langchain.prompts import ChatPromptTemplate, MessagesPlaceholder
from langchain_core.runnables import RunnableWithMessageHistory
from langchain_community.chat_message_histories import ChatMessageHistory
from langchain_community.llms import Ollama
from langserve import add_routes

设置环境变量

import os

os.environ["MODEL_NAME"] = "deepseek-r1:14b"
os.environ["BASE_URL"] = "http://xxx.xxx.xxx.xxx:11434"  # 请替换为实际的Ollama模型服务地址

语言模型（LLM）初始化

我们使用 Ollama 作为语言模型，它支持 API 访问：

from langchain_community.llms import Ollama

llm = Ollama(
    model=os.environ["MODEL_NAME"],
    base_url=os.environ["BASE_URL"],
    temperature=0.3  # 控制生成随机性，0.3 表示输出稳定但仍有一定随机性
)

优化建议：

• temperature=0.3 表示平衡创造性与稳定性。如果你的应用更需要精准回答（如金融、法律），可以设为 0.1，而如果更注重对话自然性，可以调高到 0.7。
• 可选模型优化：如果你要使用 OpenAI API 或其他模型，LangChain 允许快速切换，例如：

from langchain.chat_models import ChatOpenAI

llm = ChatOpenAI(
    model_name="gpt-4",
    api_key=os.getenv("OPENAI_API_KEY")
)

提示模板（Prompt Template）

良好的 Prompt Design 直接影响 LLM 的回答质量，我们可以使用 ChatPromptTemplate 进行定义：

from langchain.prompts import ChatPromptTemplate, MessagesPlaceholder

prompt_template = ChatPromptTemplate.from_messages([
    ('system', '你是一个支持多轮对话的AI助手，请确保回答简明且准确。'),
    MessagesPlaceholder(variable_name='history'),
    ('human', '{input}')  # 用户的输入
])

实际应用优化建议

• 提升提示词质量，例如：

('system', '你是一个专业的AI助手，能够处理用户的问题，并根据上下文提供精准的回答。请遵循以下规则：1. 避免冗长 2. 仅在必要时请求更多信息 3. 保持友好而专业。')

• 增加 role 适配性，例如客服聊天机器人可以使用：

('system', '你是一个客户支持助手，请基于历史对话提供最符合用户需求的帮助。')

多轮会话管理

为了实现 持久化会话，我们使用 ChatMessageHistory：

from langchain_community.chat_message_histories import ChatMessageHistory

session_store = {}

def get_session_history(session_id: str) -> ChatMessageHistory:
    if session_id not in session_store:
        session_store[session_id] = ChatMessageHistory()
    return session_store[session_id]

实际应用优化方案：

• 使用 Redis 作为持久化存储：

from langchain.memory import RedisChatMessageHistory

session_store = {}

def get_session_history(session_id: str) -> RedisChatMessageHistory:
    if session_id not in session_store:
        session_store[session_id] = RedisChatMessageHistory(url="redis://localhost:6379", session_id=session_id)
    return session_store[session_id]

这样可以支持跨进程会话管理，适用于集群部署。

处理管道（Processing Pipeline）

构建聊天处理流程：

from langchain_core.runnables import RunnableWithMessageHistory

defconvert_output_to_dict(output: str):
    return {"response": output}

conversation_chain = (
    prompt_template
    | llm
    | convert_output_to_dict
)

chain_with_history = RunnableWithMessageHistory(
    conversation_chain,
    get_session_history,
    input_messages_key="input",
    history_messages_key="history"
)

优化建议：

• 可以添加 token 限制，避免 LLM 输出过长：

llm = Ollama(
    model=os.environ["MODEL_NAME"],
    base_url=os.environ["BASE_URL"],
    temperature=0.3,
    max_tokens=500  # 限制最大输出字数
)

API 服务（FastAPI）

我们使用 FastAPI 作为后端：

from fastapi import FastAPI
from langserve import add_routes

app = FastAPI(
    title="Multi-Turn Chat API",
    version="1.0",
    description="支持多轮对话的智能聊天接口"
)

add_routes(
    app,
    chain_with_history,
    path="/chat",
    input_type=dict
)

# 运行服务
if __name__ == "__main__":
    import uvicorn
    uvicorn.run(
        app,
        host="0.0.0.0",
        port=12345
    )

调用效果

开启第一个会话

curl -X POST http://localhost:12345/chat/invoke \
     -H "Content-Type: application/json" \
     -d '{
           "input": 
           {
           "input":"你好，我是齐得隆咚呛"}
           ,
           "config": {
             "configurable": {
               "session_id": "session-1"
             }
           }
         }'

得到结果

你好！很高兴认识你，齐得隆咚呛。听起来像是一个有趣的名字！今天有什么我可以帮你的吗？

下面我分别用 session-1和 session-2 来问他，发现只有 session 相同时，他才知道我叫什么。说明基于 session 会话成功。

curl -X POST http://localhost:12345/chat/invoke \
     -H "Content-Type: application/json" \
     -d '{
            "input": {
                "input": "你好，我是齐得隆咚呛"
            },
            "config": {
                "configurable": {
                    "session_id": "session-1"
                }
            }
        }'


curl -X POST http://localhost:12345/chat/invoke \
     -H "Content-Type: application/stream" \
     -d '{
            "input": {
                "input": "我叫什么"
            },
            "config": {
                "configurable": {
                    "session_id": "session-1"
                }
            }
        }'

curl -X POST http://localhost:12345/chat/invoke \
     -H "Content-Type: application/stream" \
     -d '{
            "input": {
                "input": "我叫什么"
            },
            "config": {
                "configurable": {
                    "session_id": "session-2"
                }
            }
        }'