看到智能体,也许你第一想到的就是扣子。
没错,扣子的确是一个智能体平台,可以搭建实现各种丰富功能的智能体。
但是扣子≠智能体!
通俗来讲,智能体就像一个 “能自己干活的小助手”。它不是真人,但能根据设定的目标,自己观察周围环境、做判断、采取行动,甚至能从经验里学东西,不用人一步一步指挥。
比如:
-
手机里的智能闹钟,到点会响,还能根据你睡觉的规律调整叫醒时间,这就是个简单的智能体;
-
游戏里会主动追着你打的怪物,能 “看见” 你在哪、自己决定怎么移动攻击,也是一种智能体;
-
更复杂的比如自动导航的无人机,能自己避开障碍物、按路线飞到目的地,也算智能体。
智能体的核心就是:能自主感知、思考、行动,帮人完成特定任务,不用你全程盯着。
所以,扣子里的智能体是智能体,我们自己开发出一个可以按照固定步骤执行的程序也是一个智能体。本文选择的是后者,即不通过扣子搭建工作流等形式的智能体,而是基于AI编程开发出满足特定需求的程序,这里选择网页形式。
谈到智能体开发,可能大家都会望而却步,觉得这是一个很复杂、很难的事,其实不然,只要按照下面的7个步骤逐一执行,小白也能开发出功能完善、可商用的智能体产品出来。
话不多说,直接开干。
Step 1:构思初始想法
也就是需求种子,明确智能体使用的场景和要解决的问题,可以不用太详细,因为AI会帮你来完善。
这里以一个定位在情绪识别、波动分析、正向指引的智能体为例,先确定基础需求:
有些人每天都会写日记或者发朋友圈,我希望开发一个智能体——情绪罗盘,能够识别用户每天的文字背后的情绪,分析近几天的情绪波动。
比如我今天写完日记以后,能够分析出我今天的状态怎么样,比起昨天的状态有什么变化。当发现我遇到消极的事情,或者说情绪低落遭遇打击之类的情况,能够给我提供正向指引,做好情绪按摩。
Step 2:借助AI完善想法
有了基础需求,再让AI进一步丰富完善,这里还是选择Kiro进行设计和实现。
选择Vibe模式、Claude 3.7模型,告诉AI,让它帮我完善我的想法:
Kiro根据我的输入完善了初始需求,补充了很多核心功能:
Step 3:生成PRD文档
有了相对完善的需求,结合希望用到的技术栈,就可以让AI生成一份PRD文档,提示词如下:
简单一点,我希望用HTML+CSS+JS实现这个智能体,请在进行需求分析的基础上完成PRD文档保存到项目目录下。
其中,进行情绪识别、分析和情绪支持等相关功能都调用大模型来实现,调用示例如下:
```
curl --request POST \
--url https://api.siliconflow.cn/v1/chat/completions \
--header 'Authorization: Bearer <token>' \
--header 'Content-Type: application/json' \
--data '{
"model": "deepseek-ai/DeepSeek-V3",
"messages": [
{
"content": "You are a helpful assistant.",
"role": "system"
},
{
"content": "你是谁?",
"role": "user"
}
]
}'
```
生成的需求文档如下:
Step 4:基于PRD编写代码
Kiro在完成PRD文档之后,就自动开始了代码的编写,不愧是我的天选打工人、太勤奋了!
既然代码已经完成,直接看第1版的效果:
需要先输入自己的API Key,这里选择的是硅基流动的API,直接点击链接https://cloud.siliconflow.cn/i/c6OvNtKu或扫描下方二维码注册硅基流动账号即可free领取2000万tokens,够用很久了:
模型选择了能力强大的DeepSeek-V3。注册好账号后在硅基流动官网左侧API密钥栏申请自己的API Key,然后复制到页面输入。
开始测试,找了一条朋友圈文案输入:
分析中就是正在调用大模型对输入的内容进行分析,几秒得到结果:
看来今天又是元气满满的一天,哪怕平平无奇的逛菜市场也能获得快乐!
还能查看历史记录:
目前只有1天,还无法查看历史记录和情绪趋势。
基本功能完成。
Step 5:提交错误信息,由AI诊断调试
可能是由于Kiro整体能力较强,第1版就正常实现了功能,没有出现错误。
报错信息一般有2个来源:
-
页面上显示的错误信息
-
浏览器控制台中的错误信息
将页面上的错误信息和控制台中的错误信息以复制文字或截图的方式告诉AI,让其进行分析和修改代码。
Step 6:补齐缺失功能
由于当前的智能体功能相对单一,Kiro一次即实现了,也没有缺失的功能。
对于复杂的智能体系统,在AI完成开发后,进行验证,对于没有实现的功能,告诉AI让其进行补全,同时通过开发进度文档等记录进度,并使用Git等工具进行回滚,方便后续如果AI将代码改成面目全非时进行恢复。
Step 7:迭代优化至功能完善可用
当前智能体的问题之一是输入API的方式不友好(如前图所示),在页面上输入比弹窗输入更友好,直接告诉AI让其进行修改:
Kiro将HTML、CSS和JS文件中需要修改的地方快速修改成功、言出法随。
测试一下:
页面简洁而美观,功能也完善!
最重要的1步:发布出去,让别人用
智能体开发出来了,肯定不是让自己一个人用的,要把它发布出去,让别人也能用到,这样自己不仅有成就感,还可以收集优化建议、不断迭代,实现与用户之间的良性循环。
租服务器+服务部署+域名配置的门槛和成本都更高,那么有没有更便捷的方式呢?特别是在进行功能预览和测试时,需要简单快捷地查看网页整体效果。这里选择MCP的方式进行部署,并选择腾讯的EdgeOne Pages MCP。
首先按照官方文档https://edgeone.ai/zh/document/177158578324279296说明申请API Token:
申请好后,按照文档https://cloud.tencent.com/developer/mcp/server/10011配置MCP:
{
"mcpServers": {
"edgeone-pages-mcp-server": {
"command": "npx",
"args": ["edgeone-pages-mcp"],
"env": {
// 可选如果将文件夹或压缩文件部署到EdgeOne Pages项目,需要配置EdgeOne Pages API令牌。
"EDGEONE_PAGES_API_TOKEN": "YOUR_API_TOKEN",
// 可选。留空以创建新的EdgeOne Pages项目,提供项目名称以更新现有项目。
"EDGEONE_PAGES_PROJECT_NAME": ""
}
}
}
}
将你自己申请的API Token填充,然后在Kiro中配置MCP:
最后就可以动嘴让Kiro部署了:
然后就可以访问返回的链接了:
但是,通过这种方式生成的访问链接是临时的,不适合部署长期使用的项目,如果有长期使用的需求,建议更换其他部署平台。
上面的7个开发步骤和1个部署步骤,每一个步骤并不是严格区分的,可能有些步骤会融合在一起执行,或者相互依赖,但是不管外在变现如何,整体的过程都是要包含的,这也与一般的项目开发过程是一致的。只要熟悉了这一套流程,就算开发更加复杂的智能体系统也是可以实现的。
最后,如果你在实际操作过程中遇到任何问题,都可以扫码下方的任意二维码找到我,我们一起探讨,在AI时代一起进步:
交流经验、分享工具 | 实时获取最新AI工具动态 | 和1000+队友一起探索AI编程商业化 |
![]() | ![]() | ![]() |