为什么需要扣子开发智能体(Agent)

Qwen3-VL-30B

Qwen3-VL-30B

图文对话
Qwen3-VL

Qwen3-VL是迄今为止 Qwen 系列中最强大的视觉-语言模型,这一代在各个方面都进行了全面升级:更优秀的文本理解和生成、更深入的视觉感知和推理、扩展的上下文长度、增强的空间和视频动态理解能力,以及更强的代理交互能力

《扣子开发AI Agent智能体应用(人工智能技术丛书)》(宋立桓,王东健,陈铭毅,程东升)【摘要 书评 试读】- 京东图书

为了体现当代Agent依赖于人工智能大模型的能力,我们将其称作AI Agent、AI智能体或者人工智能体,还有一些文章将其直译为“AI代理”。目前,在计算机、人工智能专业技术领域,一般将Agent或AI Agent统一翻译为“智能体”。

在信息技术飞速发展的当下,人工智能领域持续推陈出新,智能体与DeepSeek大模型成为近期科技圈的焦点。在此时代背景下,“智能体+DeepSeek”正崭露头角,有望开启下一个重大的IT发展浪潮,引领未来变革,成为科技领域的下一个风口。

1. AI的发展历程

要向读者讲清楚智能体的概念,我们首先需要了解人工智能(AI)的基本概念。

AI是指通过计算机程序模拟人类智能的技术。这些程序可以执行诸如学习、推理、规划、自然语言处理等任务。自20世纪50年代AI概念提出以来,AI技术经历了多次重大的突破。

AI的发展历程可以分为以下几个重要阶段:

(1)初期发展阶段(20世纪50年代—20世纪70年代):这个阶段的AI研究主要集中在符号主义和逻辑推理上。艾伦·图灵提出了图灵测试,作为衡量机器是否具有智能的标准。1956年的达特茅斯会议确定了人工智能这个概念,被认为是AI研究的开端。因此,1956年也被称为人工智能元年。

(2)早期发展阶段(20世纪80年代—20世纪90年代):这一时期,专家系统成为AI研究的主要方向。专家系统通过编码专家知识来解决特定领域的问题,取得了显著的成果,但也暴露出知识获取难题和系统僵化等问题。

(3)现代发展阶段(21世纪—):随着计算能力和数据量的爆炸式增长,机器学习特别是深度学习技术迅速发展。AI系统从依赖预定义规则转向通过数据训练模型,实现了图像识别、自然语言处理、自动驾驶等多种复杂任务。

2. Agent能解决什么问题

大语言模型(Large Language Model,LLM,简称大模型)是近年来人工智能领域的重大突破之一。大模型旨在理解和生成人类语言,它们在大量的文本数据基础上进行训练,可以执行广泛的任务,包括文本总结、翻译、情感分析等。大模型的特点是基于神经网络、自然语言处理(Natural Language Processing,NLP)技术,多轮对话和写作生成能力非常优秀。尤其是像GPT-4这样的大语言模型,简直就是AI界的“超级明星”。这些模型通过海量的数据训练,具备强大的自然语言处理能力,可以生成高质量的文本,进行复杂的对话。例如,GPT-4在文本生成和理解任务中就像是“语言魔法师”。大模型能适应不同的应用场景,从生成文本到处理对话,再到复杂的决策任务,样样在行。大模型能够生成高质量的自然语言文本,就像一个写作天才,永远不会有创意枯竭的时候。

现在已经有了AI大模型,例如DeepSeek、OpenAI的GPT、字节的豆包等,为什么又出现了Agent,这是刻意为了显得厉害搞出来的概念吗?

我们列举个例子,当你想要让大模型帮忙整理一篇文章,假设你这样问大模型:请你帮我生成一篇100万字的武侠小说。这个时候,AI大模型给你什么答案!是不是写不出这么多字,也给不出你想要的答案?

为什么会出现这种问题?是不是AI大模型不够厉害?假设这件事让我们人类来做,我们一般会按照如下流程来完成这件事:

第一步:使用搜索引擎搜索一些相关书籍和信息进行阅读,为我们打开思路。

第二步:形成本书的大纲,并且考虑清楚每一个章节要编写的内容。

第三步:针对每一个章节进行内容的编写,在编写过程中可能会调整文章的大纲。

第四步:在编写后面章节的时候,可能会忘记前面写的内容,需要翻阅前面已经完成的内容。

第五步:文章初步完成之后,我们可能会找相关专业人士帮忙修改和审阅。

第六步:也是最后一步,经过几番调整之后,书稿最终成型。

大模型不能直接完成这件事,是大模型的能力不行吗?不是的,这是因为明显缺少了几个步骤:没有办法使用搜索引擎获取最新的外部信息(大模型的训练数据是以往数据,有日期限制的);没有对整个事情进行规划(比如先写大纲,再编写每个章节,然后和别人讨论,最后成文);大模型没有记忆的能力,由于上下文(脑容量)的限制,无法一次性完成100万字的文章,会造成前言不搭后语的现象。

而智能体Agent就是为了解决这个问题。思考一下,为了完成这个任务,我们用到了这些操作:上网查询、分解任务、逐步规划、审核修改。这里面涉及规划、思考、步骤等操作,还用到大脑、手、计算机或者助手等“工具”。大模型在这个过程中只充当了大脑思考的角色,它没有额外的工具、没有规划和额外步骤,因此这个任务交给它,它是无法单独完成的。为了让大模型能够真正满足我们的要求,我们需要给它配备上网查询的能力、使用工具的能力、分解任务的能力等。

这就是Agent的价值,它使得大模型不仅仅是一个大脑,而且还是一个能做规划、能使用工具的类人智能体。

再举个例子,假设你让大模型帮你写工作日报,可以不可以?可以,但操作会很复杂。AI Agent写工作日报就不同了,设定好格式、语气、任务等关键信息,你只需要口语化告诉它做了什么,剩下的事它会帮你自动完成。

假设你让大模型帮你写一篇软文,可以不可以?可以,但操作同样复杂,来来回回折腾几遍可能还不能让你满意。用Agent来写软文就不同了,提前设定好标题、开头、内容和语气等关键信息,告诉Agent你要写什么主题内容,它就能按照设定一步一步帮你完成。

假设你去旅游,让AI帮你介绍景点信息,可以不可以?可以,但是每次你都要主动发问,AI还不一定回答正确。用Agent就不同了,按照景点情况设定好Agent,你走到哪,它就会告诉你景点的相关信息;你问他洗手间在哪,它还可以根据你的位置给你指定最近的洗手间。

通过上面介绍的这些例子,我们理解了Agent和大模型使用起来到底有什么不同。简单来说,大模型相当于可以咨询的大脑,Agent相当于有智慧又能干活的机器人。

3. 扣子发布Agent的渠道(部署)

扣子支持的发布渠道非常多,可以发布到抖音、飞书、钉钉、掘金社区、微信、微信公众号等,还可以与企业现有的业务系统(如企业网站、内部管理系统)对接。这些部署方式均基于字节跳动提供的云端技术支持,用户无需自行搭建服务器即可完成跨平台功能扩展。

您可能感兴趣的与本文相关的镜像

Qwen3-VL-30B

Qwen3-VL-30B

图文对话
Qwen3-VL

Qwen3-VL是迄今为止 Qwen 系列中最强大的视觉-语言模型,这一代在各个方面都进行了全面升级:更优秀的文本理解和生成、更深入的视觉感知和推理、扩展的上下文长度、增强的空间和视频动态理解能力,以及更强的代理交互能力

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值