最近 DeepSeek 普及,大家肯定都习惯做啥事都先问一问。
但有个问题,为什么 AI 集成已有服务的进展这么缓慢?每个功能都是孤立,自己来回复制黏贴。
我大概能猜到的理由:1)数据敏感 2)缺少标准。说白了没人挑头搞事。
昨天奥特曼直接申明支持 MCP(Model Context Protocol),而这个标准是 Claude(Anthropic) 主导发布的,相当于两个重量级公司都支持了。
说个题外话,本来最好的机会应该属于 OpenAI,当时 GPT 横扫全球,但是逐渐变成了 CloseAI,发布的 GTPs 也逐渐没了声响,最终只能「很高兴」地接入 MCP。
一、什么是MCP
一切的起源是 anthropic 官网的这篇文章:https://www.anthropic.com/news/model-context-protocol
里面是这么描述的:
It provides a universal, open standard for connecting AI systems with data sources, replacing fragmented integrations with a single protocol. The result is a simpler, more reliable way to give AI systems access to the data they need.
它为连接 AI 系统和数据源提供了一个通用开放标准,用单一协议取代了分散集成。结果是 AI 系统可以更简单、更可靠地访问其所需数据。
再有就是网站:https://modelcontextprotocol.io/introduction 中,如此描述:
MCP 是一种开放协议,它标准化了应用向 AI 应用提供上下文的方式。您可以将 MCP 视为 AI 应用的 USB-C 端口。正如 USB-C 提供了一种将设备连接到各种外围设备和配件的标准化方式一样,MCP 提供了一种将 AI 模型连接到不同数据源和工具的标准化方式。
上面的图片,很形象的展示了 MCP 的功能,就像是扩展坞——别管电脑(大模型)有什么接口了,其他设备(软件)都给我接上扩展坞(MCP),就都能连上了。
至于图片里 MCP Host / Client / Server 具体是啥,其实对于大多数人来说不重要。
二、为什么需要 MCP
肯定有人会问:AI 智能体(Agent)平台不是可以解决类似的问题?比如写作公众号文章,利用 Coze 就可以一键写作加发布到平台,也没有上面提到的问题啊?
平台上提供的可以调用工具的模型,都是带有 functionCall 标记的,具体实现是跟模型和平台强相关的。
比如上面展示的 DeepSeek 带工具调用的模型,也不是跟普通版本一起上线,说明每个模型都有额外的开发成本,无法直接套用。
那就更不用提不同平台之间了,几乎就不可能兼容。
综合来看,就是 functionCall 方案,在不同模型、不同 AI Agent 平台之间无法通用。
而 MCP 的优势就体现出来了—— 用程序员的说法就是,不用重复造轮子了,而更大的优势是能更好地构建一个可以处理复杂、多步对话和统一上下文的 AI Agent。
三、MCP 的工作原理
先看下官方的架构图。
-
MCP 主机(MCP host) :希望通过 MCP 访问数据的程序,例如 Claude Desktop、IDE 或 AI 工具。
-
MCP 客户端(MCP client):与服务器保持 1:1 连接的协议客户端。类比业务专员,特定需求派特定的人去对接。
-
MCP 服务器(MCP server) :轻量级程序,每个程序都通过标准化模型上下文协议公开特定功能。类比业务专属「翻译官」,让客户端和各个数据源对接。
-
本地数据源(Local Data Sources) :MCP 服务器可以安全访问的你计算机里的文件、数据和服务。
-
远程服务 (Remote Services):MCP 服务器可通过互联网(例如通过 API)连接到的外部服务。
一个业务流程图可能是这样的:
整个流程是这样的:你的问题 → Host → 大模型 → 需要特定功能 → Client 连接 → Server → 执行操作 → 返回结果 → 大模型生成回答 → 显示答案。
四、MCP 的展望
有了 MCP,下面的场景就不再是幻想:
-
直接通过 IDE 利用其他工具制作交互图片,自动写代码,最后提交到代码仓库
-
直接打开手机各个购物平台获取商品信息和价格,并且比对产品并下单
-
通过某一个 AI 应用来做到联网搜索、发送邮件、发布自己的博客等等
-
。。。
你可以理解为一个简化版本的「贾维斯」,以前只可能出现在科幻电影了,现在至少能想象下它的雏形了。
大家后续想实现类似功能,就不用自己开发了,这里有官方住址的一些实现案例: https://github.com/modelcontextprotocol/servers。
但整体还是比较混乱,有很多缺少教程和文档,使用还是得费点心。
Cursor 用户可以参考文档:https://cursor.directory/。
结语
MCP 标志着 AI 从「嘴强王者」到「实干派」的重大转变。
不仅是提高了我们的工作效率那么简单,甚至存在开辟全新生活方式的可能性。
大模型&AI产品经理如何学习
求大家的点赞和收藏,我花2万买的大模型学习资料免费共享给你们,来看看有哪些东西。
1.学习路线图
第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;
第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;
第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;
第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;
第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;
第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;
第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。
2.视频教程
网上虽然也有很多的学习资源,但基本上都残缺不全的,这是我自己整理的大模型视频教程,上面路线图的每一个知识点,我都有配套的视频讲解。
(都打包成一块的了,不能一一展开,总共300多集)
因篇幅有限,仅展示部分资料,需要点击下方图片前往获取
3.技术文档和电子书
这里主要整理了大模型相关PDF书籍、行业报告、文档,有几百本,都是目前行业最新的。
4.LLM面试题和面经合集
这里主要整理了行业目前最新的大模型面试题和各种大厂offer面经合集。
👉学会后的收获:👈
• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;
• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;
• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;
• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。
1.AI大模型学习路线图
2.100套AI大模型商业化落地方案
3.100集大模型视频教程
4.200本大模型PDF书籍
5.LLM面试题合集
6.AI产品经理资源合集***
👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓