MCP协议

最新推荐文章于 2025-08-19 09:05:26 发布

原创最新推荐文章于 2025-08-19 09:05:26 发布 · 1.6k 阅读

8 ·

CC 4.0 BY-SA版权

文章标签：

#人工智能

大模型专栏收录该内容

172 篇文章

订阅专栏

部署运行你感兴趣的模型镜像

MCP（Model Context Protocol，模型上下文协议）是由Anthropic推出的开源协议，旨在标准化大型语言模型（LLM）与外部数据源及工具的交互方式。它通过定义统一的接口和安全通信机制，使大模型能够动态调用外部API、访问实时数据，并执行复杂任务，从而突破传统AI的“信息孤岛”限制。

一、MCP协议核心架构

MCP采用客户端-服务器模型，包含三大核心组件（）：

MCP主机（Host）
- 运行LLM应用程序（如Claude桌面版、IDE插件），负责发起请求并整合结果。
- 示例：用户通过聊天界面提问时，Host生成初始指令并协调工具调用。
MCP客户端（Client）
- 嵌入在Host内部，负责与MCP服务器通信。每个Client对应一个Server的1:1连接。
- 功能：转发请求（如“搜索最新论文”）、接收结果，并维护会话状态。
MCP服务器（Server）
- 封装外部API或数据源（如GitHub、数据库、搜索引擎），提供标准化接口。
- 示例：一个Server可能实现“网络搜索工具”，接收查询指令后调用Brave API获取结果。

在这里插入图片描述

二、通信机制与协议栈

MCP基于JSON-RPC 2.0实现双向通信，支持本地与远程交互（）：

本地通信：通过标准输入输出（Stdio）实现，适用于高安全性场景（如访问本地文件系统）。
远程通信：采用HTTP/2或SSE（Server-Sent Events），适用于云服务调用（如连接Google Drive）。

数据格式：
请求和响应均以JSON结构化，例如工具调用请求可能包含：

{
  "method": "brave_web_search",
  "params": {"query": "Gemini 2.5 Pro功能", "max_results": 5},
  "id": "request_123"
}

三、大模型与API交互流程

以下以“获取某URL的博客摘要”为例，说明MCP的工作流程（）：

初始化阶段
- Host启动时，Client与预设的MCP Server建立连接，获取可用工具列表（如“网页抓取工具”）。
请求处理与工具调用
- 用户输入请求后，Host将自然语言指令（如“总结https://example.com的内容”）发送给LLM。
- LLM解析意图，生成结构化指令调用visit_webpage工具，通过Client转发至Server。
API执行与数据返回
- Server执行HTTP请求获取网页内容，返回Markdown格式的文本片段。
- Client将结果注入LLM上下文，触发二次推理生成摘要。
结果整合与输出
- LLM结合原始请求和工具返回数据，生成最终响应（如“该博客主要讨论MCP协议的三大优势：标准化、安全性和可扩展性…”）。