刚开始的时候,我们总是热衷于讨论和思考AI智能体如何构建,围绕这一目标进行设计思路和技术框架的选型,然后不断迭代打磨功能和性能。这,很重要,却不是唯一值得做的事情。于是,有人会说,找场景。嗯,这也的确很重要,场景落地代表的是AI智能体有用,不是技术的玩偶。
那么,我们再来思考两个问题:
AI智能体的最终用户,是谁?
他们是一群热衷于技术的人么?不全是,或者说,大部分都不是。他们需要这样的若干个工具来协助他们解决一些他们认为的复杂问题,可以不关注过程,但求结果符合预期。曾经遇到个坦诚的业务部门人员,“我们并不关心背后有多少个系统,但是你能告诉我这样做能对业务带来什么效果提升么”。

AI智能体的业务场景,是被创造的还是被发现的?
显然,大多数的业务场景都是本来就存在的,不是因为有了AI智能体而被创造的。所以,业务的本质和规则,并没有发生变化。只是我们多了一种新的技术实现手段,可以由点到线到面的来解决一些之前解决的不大好的问题,在原本已经遇到了效果天花板的地方找寻一些新的突破契机。

所以,更需要做的是,在可量化的评判AI智能体对业务本身带来的效果提升的同时,再让它具备自我优化的能力。为什么强调了自有优化,因为我真的很懒,并不想花大量时间去调优一个系统。所以,最好是它能自己玩一会儿。
因为,只有让真正的多数用户,业务型的人员感受到了这样做,对业务带来的价值,才能让用户愿意和AI智能体一起结伴前行,相互成就。没有用户深度参与的AI智能体,不是好AI智能体。
嗯,方向有了,接下来就是定目标了。为AI智能体的效果提升之路确定:
前进的目标
量化指标为尺提升业务效果。业务指标为主,技术指标为辅;客观指标为主,主观指标为辅。

前进的能力
以自动化为基础,尽可能减少人工参与的复杂度,构建起一个自我优化的循环体系。

先说目标,是为了提升业务效果。那么,自然是去问业务的,因为业务场景是一直都在那儿的。我们如今需要证明的是用了AI智能体能提升原本业务的效果。所以,原来的那些业务指标,依然有效。如果业务效果目标,达成了,自然是不用第一时间再去关注技术指标,从业务视角看是没有需要了。嗯,是的,我们通常容易在这里遇到的问题。如果是由人来完成业务效果提升的时候,大家对提升的度总是相对宽容。一旦转换成是通过AI智能体来提升时,自然而然的就对提升的度产生了更大的期待。我想,我们还是可以对AI智能体产生的效果再宽容一些,让它有更多的效果爬坡时间。另外,尽可能多的用客观指标,减少主观判断带来的影响。技术指标,它的意义,更多的还是在业务指标不能达成的时候,用于指引我们定位到能快速提升效果的资源项。除了智能体本身的一些常用指标项,还需要关注构建智能体的各项资源的指标,比如模型、知识库、工具、提示词、工作流和思维链。工具调用和提示词的优化,通常会被优先尝试;模型和知识库的瓶颈是被提到最多的,但其实花费的时间成本相比之下会高的多。
再说能力,构建起一个可以闭环驱动的自动化过程,用于发现“问题”、诊断“问题”、解决“问题”。之所以加引号,是因为我从不觉得,那是问题,其实都是效果优化路上的一个阶梯。明天比今天更好,今天就是问题么,当然不是。
如何发现
先让数据跑起来,再应采尽采的归集数据。然后经过指标计算,对各项指标进行评分量化,形成评价报告,方便进行评估。在这里,我倒是不纠结指标的数量和质量的,先转起来才更重要。而且,之前也提到了,更有意义的业务指标是原先就存在的,并不是因为有了智能体才被创造的。其余的,更精细的指标,留在效果优化的路上吧。面对着大量的明细数据的时候,数据特征会指引我们的。
如何诊断
评价报告有了,再结合我们的效果优化目标,自然可以找出偏离项。哦,当然,在这之前还得确定我们定义的目标没有那么的天马行空。把问题范围收窄到偏离度最大的几个指标项上,也就自然的找到了偏离对象,通常这个阶段已经能定位到了构建智能体的资源项的级别了。然后就是程序员们擅长的领域了,谁家的程序员还不会找问题了,如果真的有,就请出我们的专业测试团队。
问题分类上,我习惯分两类:数据类问题和功能类问题。
数据类问题:包括上下文的质量和知识库的知识质量。上下文和知识的情况类似,他们必然是下一个步骤的输入,输入歪了,输出自然也歪了。当然,这里是指的作为输入的上下文和知识没有经过别的二次加工。好的数据质量,可以极大地降低程序逻辑和算法的复杂度。当然,就是因为原始的数据质量不理想,技术才更体现价值。
功能类问题:指的是智能体运行过程中用到的各个资源项的功能好坏,例如输出的准确性、执行耗时等。特别提一下工具API的问题,在传统的应用体系里,上下游系统对接口,其实都是交给各自的程序员在开发过程中调试对齐的,所以是人来基本保障了工具接口的选择的合理性、输入的完整性和正确性、输出的正确获取。所以,程序员容忍和磨平了工具API的方法命名、输入输出命名的可读性之类的问题。而当我们把工具选择和调用,交给智能体之后,我们就不得不考虑大模型的语义理解能力和习惯了。因为,此处无人参与。模型、RAG、提示词这些项,可优化的空间现在应该已经不大了,能做的也已经被挖掘的差不多了。
如何解决
只要问题定义得足够清楚,问题的解决向来是水到渠成的。只是说,哪些问题是最需要被先解决的。结合预期目标来看,部分问题解决后,可能我已经达成了本轮的预期目标了,那么自然可以先放一放。其他问题的优化,那是下一个目标的事情了。而怎么判定问题得到了解决,在诊断结论和建议的指引下对智能体做出相应优化,再借助仿真回测的模拟验证和评价体系再次评分。
有目标、有能力、有体系,让AI智能体自己对自己进行效果优化升级。在自动化条件还不够成熟的环节,交给人工协同。跟随技术更新,逐步减少人工参与。
最后,我们去相信,AI智能体的落地效果还变得很好。

普通人如何抓住AI大模型的风口?
领取方式在文末
为什么要学习大模型?
目前AI大模型的技术岗位与能力培养随着人工智能技术的迅速发展和应用 , 大模型作为其中的重要组成部分 , 正逐渐成为推动人工智能发展的重要引擎 。大模型以其强大的数据处理和模式识别能力, 广泛应用于自然语言处理 、计算机视觉 、 智能推荐等领域 ,为各行各业带来了革命性的改变和机遇 。
目前,开源人工智能大模型已应用于医疗、政务、法律、汽车、娱乐、金融、互联网、教育、制造业、企业服务等多个场景,其中,应用于金融、企业服务、制造业和法律领域的大模型在本次调研中占比超过 30%。

随着AI大模型技术的迅速发展,相关岗位的需求也日益增加。大模型产业链催生了一批高薪新职业:

人工智能大潮已来,不加入就可能被淘汰。如果你是技术人,尤其是互联网从业者,现在就开始学习AI大模型技术,真的是给你的人生一个重要建议!
最后
只要你真心想学习AI大模型技术,这份精心整理的学习资料我愿意无偿分享给你,但是想学技术去乱搞的人别来找我!
在当前这个人工智能高速发展的时代,AI大模型正在深刻改变各行各业。我国对高水平AI人才的需求也日益增长,真正懂技术、能落地的人才依旧紧缺。我也希望通过这份资料,能够帮助更多有志于AI领域的朋友入门并深入学习。
真诚无偿分享!!!
vx扫描下方二维码即可
加上后会一个个给大家发

大模型全套学习资料展示
自我们与MoPaaS魔泊云合作以来,我们不断打磨课程体系与技术内容,在细节上精益求精,同时在技术层面也新增了许多前沿且实用的内容,力求为大家带来更系统、更实战、更落地的大模型学习体验。

希望这份系统、实用的大模型学习路径,能够帮助你从零入门,进阶到实战,真正掌握AI时代的核心技能!
01 教学内容

-
从零到精通完整闭环:【基础理论 →RAG开发 → Agent设计 → 模型微调与私有化部署调→热门技术】5大模块,内容比传统教材更贴近企业实战!
-
大量真实项目案例: 带你亲自上手搞数据清洗、模型调优这些硬核操作,把课本知识变成真本事!
02适学人群
应届毕业生: 无工作经验但想要系统学习AI大模型技术,期待通过实战项目掌握核心技术。
零基础转型: 非技术背景但关注AI应用场景,计划通过低代码工具实现“AI+行业”跨界。
业务赋能突破瓶颈: 传统开发者(Java/前端等)学习Transformer架构与LangChain框架,向AI全栈工程师转型。

vx扫描下方二维码即可

本教程比较珍贵,仅限大家自行学习,不要传播!更严禁商用!
03 入门到进阶学习路线图
大模型学习路线图,整体分为5个大的阶段:

04 视频和书籍PDF合集

从0到掌握主流大模型技术视频教程(涵盖模型训练、微调、RAG、LangChain、Agent开发等实战方向)

新手必备的大模型学习PDF书单来了!全是硬核知识,帮你少走弯路(不吹牛,真有用)

05 行业报告+白皮书合集
收集70+报告与白皮书,了解行业最新动态!

06 90+份面试题/经验
AI大模型岗位面试经验总结(谁学技术不是为了赚$呢,找个好的岗位很重要)

07 deepseek部署包+技巧大全

由于篇幅有限
只展示部分资料
并且还在持续更新中…
真诚无偿分享!!!
vx扫描下方二维码即可
加上后会一个个给大家发

887

被折叠的 条评论
为什么被折叠?



