体验实在Agent,这才是当前形成生产力的企业级通用智能体

体验实在Agent,这才是当前形成生产力的企业级通用智能体

图片

  • 实在Agent或是现阶段企业级通用智能体的最优解

  • 3个实操案例,带你体验真正流畅可用的企业级通用智能体

  • 什么是真正的企业级通用智能体?实在Agent立了一个行业标杆

  • 体验实在Agent,这才是当前形成生产力的企业级通用智能体

  • 几个实操案例,告诉你什么是真正可用的企业级通用智能体

  • Manus昙花一现,实在Agent或会带来一场企业级通用智能体飓风

    全文约6000字,阅读时间8分钟

    文/王吉伟

Manus的火爆,不仅带火了一批开源项目,也带来了一场通用智能体之辨。

至今大家还拿不到邀请码的Manus,以官网多个案例视频和有数的体验视频,让大家感受到了通用智能体的魅力。很多人在看完那些视频后,直言不讳那就是他们需要的智能体。另一方面,很多人在体验Manus同类项目之后非常失望,它们距离成为企业生产力还有不小的距离。

在技术圈和学术界,目前通用AI Agent(General AI Agent)被看作是一种能够自主执行任务、进行复杂决策并适应多种环境的高级人工智能系统。能够响应用户指令,主动规划和执行任务而无需频繁的人类干预。这种系统通常基于多个大型语言模型(LLM)和其他独立运行的软件组件,以实现更广泛的任务处理能力。

需要说明的是,目前不同公司对AI Agent的定义差异很大,从完全自主系统到预定义工作流的实现都有。因此通用AI Agent的“通用”程度,尚未有统一标准。

图片

而真实的体验与应用反馈是,如果通用智能体是现在这种产品形态,还不如直接用RPA等工具去实现各种电脑应用自动化的操作。大模型与AI Agent技术架构比比皆是的当前,企业对于应用引入大模型和应用智能体的渴望是炽烈的,对于适合当前阶段的企业级智能体解决方案的需求自然也是强烈的。

面对通用智能体的热潮和企业级应用的需求,广大企业与组织对于真正可用的技术、产品及解决方案可以说是翘首以盼。

那么,在当前AI Agent应用早期阶段,到底什么样的智能体才算通用智能体?广大企业需要的企业级智能体又应该是怎样的?有没有体验更好、执行能力同时运行稳定的企业级智能体能胜任企业大量的复杂业务流程?

本文,基于王吉伟频道对类Manus产品与项目的了解,并对典型通用智能体实在Agent做了一些研究,希望能给大家一些参考和启发。

👉[优快云大礼包🎁:全网最全《LLM大模型入门+进阶学习资源包》免费分享(安全链接,放心点击)]()👈

从通用智能体说起

从当前智能体产品形态来看,王吉伟频道把当前的通用智能体分为两类:

一类是被称为computer use Agent的类似Manus的产品,采用大模型(推理模型+多模态模型)+API模式,通过屏幕截图来识别屏幕元素,以API接口调用各种工具执行任务。

图片

另一类是在RPA等流程自动化工具基础上融合AI Agent架构并把RPA当作超级工具的Agent,这类产品基于原有业务流程自动化技术的沉淀,适配大模型、RAG、屏幕识别等技术,实现智能体流畅操作电脑上各种应用。

受大模型能力、技术架构、工作模式等因素的影响,目前第一类通用AI Agent在体验上并不是很好,等待时间长,任务执行能力差,效果不可控。第二类通用AI Agent因为RPA本身就已经与PC、手机等终端有了很好的融合与适配,体验上比前者要好很多。

显然实在智能刚发布的新版实在Agent属于后者。实在智能CEO孙林君认为,一个面向各种场景、具备良好泛化能力且无所不能的通用智能体,至少应该具备两点:

首先应该突破基础模型所不具备的一些能力,在任务理解上要掌握足够多的知识;其次智能体在基础模型上所结合的工具,在底层能力上要具有完备性,对于操作系统内部应该是一个“无所不能”的状态。

为了让大家看懂两种Agent的区别,这里以实在Agent为例做了一个对比表格。

图片

另一个角度,通用智能体的一大特点是能够自由操作电脑上的各种应用去执行各种任务。

其实从computer use或者GUI智能体的角度来看,实在 Agent脱胎于能够完美操作电脑端或者手机端的采用成熟技术的RPA,本身与电脑有着天然的亲和力。在当前智能体应用的初级阶段,这类智能体可以算是真正形成生产力的通用智能体。

来看几个真实案例

光说不练假把式。接下来实操几个实在Agent应用案例,让大家感受下第二类通用智能体的能力。

想要体验实在Agent,首先需要到实在官网下载客户端,网址如下:

https://www.ai-indeed.com/downloadCenter

安装以后打开软件,默认软件界面非常简单,只有一个指令输入框,可以按CTRL+SPACE组合快捷键随时关闭和打开。

图片

点击左边的logo,打开软件完整界面。

图片

先来试两个官方应用案例模版。

案例: 豆瓣电影数据获取**

点击 数据分析 这个模版,指令“获取豆瓣电影排行榜数据(电影名、评分)”会出现在指令输入框。

图片

点击输入框右边的右箭头或者按回车键,短暂的等待后,软件会把这个指令拆解为4个主要分析步骤步骤,点击 执行 按钮 或者按回车键,软件开始执行任务,默认使用内置的实在浏览器。

图片

这里说一句,直接使用内置web程序这一步迭代非常好。不需要用户再去Chrome等浏览器安装插件,单是这个过程就困扰了很多小白用户。

执行任务过程中,鼠标会自动点击相应的网页元素,最终提取豆瓣电影相关的数据展示在软件内,可以自由到处表格为Excel表格。

图片

全部任务执行过程,见下面的视频动图。

图片

案例2: 多平台舆情分析

实在Agent不仅支持流程创建,还支持调用智能体。点击关于雅诗兰黛市场反馈的 “数据分析”模版,指令会自动输入到指令输入框,可以看到这个案例实在与智能体 “舆情分析及时助理”对话。该智能体会在百度、知乎、微博等3个平台提取数据并汇总分析,使用这个模版前记得先登录知乎和微博。

图片

回车进入任务执行页面,短暂的任务拆解之后,点击执行按钮,“舆情分析及时助理”就进入了它的工作流程,电脑会自动打开浏览器在3个平台进行数据提取,最后通过大语言模型生成舆情报告。下面,是全部操作流程的视频动图。

图片

对于这样在多平台提取数据的应用,底层为RPA的实在Agent可以说是信手拈来。整个执行流程大概用了3分钟,如果用纯视觉靠屏幕截图识别定位GUI元素的CUA智能体,这个时间延长一倍,任务也执行不完。

这里尤其推荐它的“小窗执行”功能,可以在独立桌面环境运行,不干扰用户在电脑上的其他操作。在它执行任务的同时,你还可以做另外的事情,工作效率倍增。

图片

这个案例调用的智能体是官方发布的。目前实在Agent已经上线了8个常用智能体,用户可以随时与这些智能体对话布置想要的任务。如果这些智能体无法满足你的个性化需求,还可以自己创建面向你业务应用的智能体。

图片

实在Agent的智能体构建方面,“自由画布”比较有亲和感,拖拉拽都很流畅。与其他Agent构建平台不同的是,这里多了一个自动化板块,在构建智能体时可以直接调用已经构建好的流程和智能体,并支持接口调用和功能代码。

图片

这个板块的增加,可以大大增强智能体与企业内部已有自动化流程的衔接,便于企业快速进行智能体的部署与应用。目前他们也上线了DeepSeek大模型,用户可以在构建基于DeepSeek构建推理能力更强的智能体。

*案例**3**:剪映图文成片自动化***

体验完官方案例模版,再来试试实际操作。

通用智能体其中的一个表现是可以操作流畅操作电脑上的各种应用。我们可以试着让实在Agent操作剪映,把一段文字剪成图文视频。

实现方式:首先在实在Agent调用DeepSeek,生成短视频脚本。新建对话,输入@ 在智能体列表中找到DeepSeek,输入指令:生成一段关于AI Agent的短视频脚本

图片

然后需要把这段脚本放在剪映中自动生成视频。新建对话,输入指令:

打开剪映的 图文成片 功能,使用其中的 自由编辑文案 功能,把下面这段内容输入文本框,点击 生成视频 中的 智能匹配素材 ,生成视频

AI Agent*,不仅是工具,更是你的智慧延伸。它能理解你的需求,学会你的习惯,帮助你高效完成任务。从日常生活到复杂工作,AI Agent都能成为你的得力助手。*

图片

实在Agent把任务拆解为5步,在具体执行中输入内容以及点击按钮有点错误,只需要把输入内容修改正确,重新拾取下按钮元素就可以正常运行了。具体操作视频如下。

图片

这个流程,以后是可以复用的,也可以用于AI Agent的构建。比如这个案例,就可以把这两步结合起来构架一个用于剪映自动成片的智能体。

虽然这种自建流程还没有经过官方的强化训练,却证明了通过详细指令编写和简单的人工辅助,就能实现需要的功能,基本就是小白级的操作。没有经过强化训练就能做到这种程度,可见此类产品的巨大潜力。

实在Agent的不同之处

以上几个案例,主要还是个人使用体验。在B端企业应用上,RPA与AI Agent的融合,会因业务、客户、生态、技术路径等方面的不同,在产品形态上也会有所差异。比如实在Agent与Manus等产品就有了明显的差异化。

两者的主要区别,可以体现在技术架构、任务闭环能力、商业化成熟度、准确性、稳定性、操作体验、扩展能力以及用户认知门槛等多个方面,具体可以见下图。

图片

通过以上几个案例,大家应该对实在Agent有些了解了,使用起来真的非常简单。之所以能有这样的应用体验,在于实在智能对于技术、用户及行业的多年沉淀、深度洞悉与深入理解。

在智能体的产品定义方面,实在智能下了很深的功夫,他们认为合格的智能体产品至少应该具备三点:使用门槛要低,使用方式要简单直白,执行过程欲随心掌控。这三点对于智能体产品的重新定义,极大地降低了智能体的使用门槛并提升了易用性,对普通用户极为友好。

最新发布的实在Agent开放了智能体搭建能力,用户可结合模型技能库和编排工具开发专属AI智能体,并获得完整使用生态。实现了RPA流程与AI工作流融合,升级为智能体画布,支持自然语言交互,融合大模型与RPA能力,适应复杂场景。并且RPA用户流程可一键转为智能体形态,客户端覆盖搭建到运行全环节,提升开发效率。搭建好的智能体可被自主调用,Tars大模型能学习并自动执行任务。

基于实在智能五年积累的近500+的RPA原子组件和业务流程,具备连接和执行能力,能解决跨系统操作和数据摆渡,帮助用户完成业务办理。其生成的RPA组件可重复利用,方便自定义智能体开发。还具备数据分析和文件处理能力,借助大模型推理和代码生成,支持API集成,可联网查询信息。Tars大模型作为决策中枢,能自主调动工具并匹配用户自定义智能体,持续提升上限。

这些,也正是实在Agent的独有特色与不同之处。

**
企业需要什么样的智能体?**

前面实操的案例,更多是实在Agent在C端的能力体现。作为能够在复杂环境中运行的通用智能体,只有能够适用更多企业级的业务场景才能成为企业的生产力。

目前的通用智能体已经实现了使用电脑,但更多还是实验性的项目,无法更好地融入广大企业复杂的业务流程当中,难以实现企业级商业化应用。很多时候,企业引入智能体是一回事,应用起来却是另一回事。

最近有个读者跟我交流,他们想通过智能体替代员工在企业信息化系统中的重复性操作,正在寻找相应的技术路径和解决方案。事实上对于这类跨应用、跨系统的需求,目前大家所看到包括Manus、Ominiparser以及相关开源项目在内的CPU类项目都无法全部实现,或者说只能通过API链接包括现在火爆的MCP完成一部分轻量化的业务流程,对于深入到企业管理系统底层的复杂业务流程,涉及到大量没有API接口的数据连接,目前无法实现。

图片

孙林君认为,大模型存在两种应用方式的局限。一是端到端大模型虽能解决多问题,但遇到幻觉时难以调优,优化成本高且不可控。二是大模型结合API的方式,受限于API开发依赖人工、成本高,且系统设计原则要求低耦合,接口数量不宜过多。大模型加人工的方式,并非更合理选择。未来,大模型应能直接驱动工具操作软件界面完成工作,软件界面本身也是一种协议,这种方式更具潜力。

API不是万能的,API无法连接一切,但企业运营却需要最大化的连接系统与应用。目前来看,至少现阶段这个需求还是要落到基于大模型等技术的RPA类自动化Agent解决方案的身上,或是通过AI+RPA+Agent的解决方案来提升企业对于Agent的应用能力。

那么,企业到底需要什么样的智能体呢?融合RPA和Agent的企业级智能体又应用有哪些终极考核标准或者说成为企业的优质增长杠杆呢?

广大企业所需要的智能体,必然是能够落地并满足业务需求的智能体,而智能体想要真正落地必需做到可控、稳定和高效。可控即过程清晰、结果准确率高,稳定是指多次运行成功率高且结果稳定,高效则是构建效率高。这三点,正是实在Agent满足商业化落地的三大核心能力。

图片

基于这三大核心能力,经过众多客户案例的实践,实在智能总结了企业级智能体落地至少需要具备以下四个方面的能力或服务:

首先,要有专属的企业知识库。企业在生产经营中积累了大量文档和数据,这些是企业独有的宝贵资产,也是员工真正需要的知识。通用大模型无法涵盖这些内容,因此企业需要沉淀自己的知识库并具备数据分析能力,以实现落地应用。

其次,要有专属的业务系统操作指南。经过30多年的信息化建设,企业内部已有多套系统,每套系统都有独特的业务特性和操作流程。智能体要实现自动化业务办理,必须理解这些系统的操作规范,根据企业的业务流程来指导其操作。

第三,要支持模型的接入。大模型能力不断进化,企业需要根据自身业务特性选择并接入适合的大模型。一些企业可能需要对模型进行微调,微调后的模型也必须能够灵活接入智能体平台,以发挥其最大效能。

最后,要支持私有化部署。出于数据安全、风控和监管等因素,大型企业更倾向于私有化部署方案。实在Agent支持多种环境的私有化部署和国产化适配,满足企业在合规基础上的智能化升级需求。

这四点,很好地总结了企业级Agent的特点,当然也把真正的通用智能体门槛提升了几个Level。从这几点而言,在原有企业级平台及解决方案的基础上打造的智能体,先一步成为了企业级通用智能体,这也是我之前一直在说的TO B类的企业会优先吃上智能体红利的一个主要原因。

图片

图:实在Agent的终极价值与核心能力

除了这几点,实在智能将智能体的落地经验总结为成本可控、安全可用、灵活接入,非常形象的概括了企业级智能体解决方案的特色,当然也体现了广大企业的痛点所在。实在智能对于企业级智能体的定义,给行业树立了一个标杆。

读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用

对于0基础小白入门:

如果你是零基础小白,想快速入门大模型是可以考虑的。

一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。

包括:大模型学习线路汇总、学习阶段,大模型实战案例,大模型学习视频,人工智能、机器学习、大模型书籍PDF。带你从零基础系统性的学好大模型!

😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓
在这里插入图片描述

👉AI大模型学习路线汇总👈

大模型学习路线图,整体分为7个大的阶段:(全套教程文末领取哈)

第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;

第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

👉大模型实战案例👈

光学理论是没用的,要学会跟着一起做,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。

在这里插入图片描述

👉大模型视频和PDF合集👈

观看零基础学习书籍和视频,看书籍和视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
在这里插入图片描述
在这里插入图片描述

👉学会后的收获:👈

• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

👉获取方式:

😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值