从今年上半年开始,随着AI大模型能力的不断提升,打量的AI应用开始如雨后春笋般出现,不管是Cursor, Manus等等,它们基于AI agent,MCP servers的能力快速迭代,也大大提升了我们的开发效率。但是费用太高却让大多数人望而却步。对于小白,或是对于初学者,究竟要怎么尝到AI开发的甜头。今天我们聊聊如何使用平替版本的AI IDE,免费使用大模型。最终实现一句话生成一个完整的游戏(提示词已给出在文末)。

1、环境准备
- IDE: vscode
- IDE 插件: vscode插件市场搜索cline,直接下载即可。(cline暂不支持jetbrain,jetbrain的话可以使用continue,但是体验下来个人觉得不如vscode+cline)
- Deepseek:DeepSeek 开放平台申请 api key。新用户注册会送10元的api额度,足够我们目前的这个教程使用了。
- 如果你已经知道什么是AI agent与MCP了,就直接跳到第4小节的内容。
2、什么是AI Agent
在此之前还是解答一下许多人最常见的一个困惑,什么是AI agent?
回答这个问题之前我们还是要回到我们传统的大语言模型说起,也就是我们所熟知的chatgpt, deepseek,混元,豆包,千文等等各个公司推出的大模型对话应用。早期大模型的核心能力也就是我们问什么,它回答什么,能快速地从训练的模型中找到我们想要的正确答案,比如文案,建议,代码片段等等。
但是,这样还不够,这样的大模型并不会有着实际的执行动作,随着大模型日渐成熟,我们更期望地是大模型能够真正的替我们干活,而不是一个光说不做的假把式。比如,我问deepseek:“给我写一段代码”,然后期望它能够把代码真正地写出来,这就不仅仅包括一个代码片段,而是像我们自己编写代码的过程一样,先在我的D盘的code文件夹下新建一个代码文件,比如hello.py, 然后再编辑文件,编写代码,编写完成后执行代码,查看是否符合预期等等… 于是,AI agent就这样诞生了。所以通俗地解释AI agent, 就是,我们让一个只会对话输出文字的大模型,拥有了调用工具,执行某项具体任务的能力。换成更简单的公式化理解就是
AI agent = 大模型 + 工具
理解了上面这个例子后,也就大致明白了AI agent的。AI Agent就是能在数字世界里"独立思考"和"自主行动"的智能程序。
| 传统对话模型 | AI Agent |
|---|---|
| 被动响应问题 | 主动采取行动 |
| 单一对话场景 | 多任务协同 |
| 固定知识库 | 动态学习更新 |
| 纯文本交互 | 可操作现实系统 |
3、MCP servers
有了AI agent,随之而来也出现了新的问题。不同的用户,不同的开发者,不同的公司对于AI agent要具体执行的事情,都会存在相似大背景下的不同小需求。这就导致了大量的重复劳动。比如我们让AI agent去查询我们的公司资料库,然后写一篇推文这样的事情,可能每个公司的资料库的地址,发布推文的方式存在细微的差异。如果每个使用者都去自定义agent,这无疑是不高效,或者说不优雅的解决方案,并且agent也很难复用和共享给他人使用。因此Anthropic 公司敏锐地发现了这个问题。他们认为,工具应该有一套通用的语言和接口规范,于是 MCP(Model Context Protocol,模型上下文协议)应用而生,让AI应用开始了新一轮的爆发出现。 那么MCP换成是个中国人都能懂的话,就相当于AI界的秦始皇,颁布了书同文,车同轨的规范。

在这套协议中,MCP定义了大模型如何发现、理解以及调用外部工具的标准协议。通过MCP client与 MCP server的交互来实现。
MCP Client(客户端): 通常是使用工具的一方。也就是我们实际会用到的 AI 应用,比如 元宝客户端、Cursor 编程工具等。
MCP Server(服务端): 也就是提供工具的一方。任何拥有 API 或软件服务的公司,都可以按照 MCP 规范把自己包装成一个 MCP Server,把原来给人用的工具,改造成能让 AI 理解和调用的工具。
我们假设一个场景,我们给手机的智能助手说“明天10点组织项目例会”,agent收到后,就开始理解,提取出时间,参会人,注意,于是请求mcp server分别查询我的日历系统查看日程是否冲突,查看会议室系统是否能预定到会议,都确认无误后再操作邮件系统发送

最低0.47元/天 解锁文章
25万+

被折叠的 条评论
为什么被折叠?



