OpenAI官方的AutoGPT要来了!实测效果很优秀

作者 | 夕小瑶科技说  编辑 | 夕小瑶的卖萌屋

点击下方卡片,关注“自动驾驶之心”公众号

ADAS巨卷干货,即可获取

fff36482da208e20f2e805d5ee42a434.png

OpenAI官方AutoGPT,要来了!就在AutoGPT项目破10万Star之际,OpenAI也放出重磅炸弹,由联合创始人格雷格·布洛克曼(Greg Brockman)亲自现场演示了ChatGPT即将上线的新功能。比如要一张这样有氛围感的晚餐图片:

cbffeb47c4762010e71ed663a4ba04a0.gif

不劳您亲自写提示词,它来:

068f177e50fd049b43155a220c95c1cb.png

采纳ChatGPT推荐的菜谱之后,想要去买食材?直接一句话,买菜平台的购物车就给你加好了:

9cdb3d042b89177df97d918e8bf12612.gif

想要分享买了啥?一句命令直接链接发推特,整个过程你根本不用打开“小蓝鸟”:

d1f89108d39a60817f40ec9cc1179c8c.gif c498014dce8dbaa3031aded49d02f043.gif

联网能力的加入,则可以让它自动对回答进行事实核验。

5ead59e92536eec0f31a0d37e3895f72.gif

甩给它一个Excel文件,也是唰唰唰就开始分析:

3bca8c76cd1b52fda3f6f63c97a62e9e.gif

完全是AutoGPT的感觉了有没有!在演示现场,联合创始人布洛克曼剧透,新功能上线的时间,就在我给大家演示完之后(After this talk, you will be able to access this yourself)。

3d8ee14d2b23f254e656680784c0346e.png

话音刚落,掌声雷动。要知道,此前OpenAI官宣要在ChatGPT上引入插件功能就引发热议。如今随着实测效果曝光,丝滑的效果更是把期待值拉满了。有网友就表示:

在TED演讲现场真实测试发一条推特,可见你们对自家AI的信任!

b742f0634e595a7712375e98ad3bc0b5.png

不过在等待结果时,老哥看着还是非常屏气凝神的,后面测试成功后才笑了起来~

d5d3beee67b33e4f86f10fa9c8057c44.gif

所以,ChatGPT这些新功能具体效果如何?就跟着老哥一起来看看。

聊天界面直接加购物车、发推特

如下图所示,即将到来的“Auto功能”藏在三个不同的新模式之中:

Browsing、Code Interpreter和Plugins。

5ac840d4337460a2993078bc1af20a22.pngPlugins可以让ChatGPT接入各种外部应用,Browsing能开启联网能力,Code Interpreter则通过自动写代码帮你进行各种数据分析。先看Plugins模式。布洛克曼首先演示了ChatGPT接入Dall·E后拥有的新能力。

我们想在演讲之后进行一顿晚宴,请给我们一份食谱建议,然后把它生成一张图片”。

很快,ChatGPT就给出菜单,包括:藜麦沙拉、奶酪烤蘑菇、果盘、奶油南瓜汤、手工面包和鸡尾酒等等,每个菜都详细介绍了用啥具体食材搭配。

4622c7fbe8981554e15a023d0a98334c.gif

然后依靠Dall·E App插件,一张看起来非常有氛围的大餐图片就出来了。

ebca9960153ec4bf7fb180ff8f0d0bb7.gif

布洛克曼介绍,Dall·E插件在画这张图时,其实就是自己给自己写提示词,写了下面这么一大堆:

1e5450c06b6483f98763024491175f3e.png

搁在以前,这都是需要我们人类自己来做的。现在这种“小事儿”交给ChatGPT就行了。生成食谱之后,该准备相应的食材了吧。同样,只需要给ChatGPT下达命令:选择“Instacart”(美国生鲜电商)插件,输入文字“现在为之前建议的菜谱列一份购物清单”。在这里,布洛克曼还给它加了个小任务:“并在推特上分享给所有TED观众”,这就需要选上一个叫做“Zapier”(一个可以连接各种应用的自动化工具)的插件。

b02d7d7c5ee183b6df5052488280c489.png

在Instacart平台加购稍微耗费了ChatGPT一点时候,然后链接就出来了(这里也用到了“检索”插件)。

f7a0305554039ced296e874e22aac66a.png

打开之后“诚不我欺”,食材都被安排好了,直接下单即可。

225880226a2a409a8ef457e88cbbf6c1.gif

(当然,在此之前,你也可以随意为某些食材增加一些数量,或者家里已经有的删掉就可以了。)接着,ChatGPT再次确认布洛克曼是否需要将链接分享到推特平台,布洛克曼回答yes。只见一顿自动操作之后,ChatGPT弹出来一个Zapier给出的预览界面,上面有布洛克曼的推特账户名称,以及一会要发布的文案供验证和检查。

38d01d240c3bdf45cb02f3c45169f3b8.gif

没什么问题后,点击Run就可以发表了。

这时的布洛克曼略显紧张,不过成功了!ChatGPT自动帮他发好了一条推特,布洛克曼本人全程连推特网站碰都没碰一下。

c8b48ecd0635744f935da3dbd7de224b.gif

量子位专门去他的主页看了一下,确实有这条推特,点击里面的链接,也确实是前面我们看到的购物车界面。

0a2e6a8e58015d9d23db00c3d8a31cc6.png

这就是强大的Plugins模式能够做的事情,是不是非常有AutoGPT那味儿了?除了这个无缝接入外部应用的操作,ChatGPT还可以自己去上网查验事实了。众所周知,聊天机器人有时会给出一些不易觉察的错误答案,引发误导。如下图所示,布洛克曼问它OpenAl的两篇博客文章“Unsupervised Sentiment Neuron”和“Learning from human preferences”的发布相隔了多长时间。ChatGPT答前者2017年4月24日发布,后者2017年6月27日发布,因此,这两份出版物相隔大约两个月。

34b4b0a13056ff29df0807a15a8a993e.png

然而事实真的如此吗?

在这里,就用切换到“Browsing”模式,然后将刚刚那个对话丢给ChatGPT,让它自己去验证一下。注意了,ChatGPT拿到需求后,并没有直接更新答案,而是一步一步地写下了自己都要查什么做了什么:

首先我将搜索第一篇文章的发布日期,来验证第一个日期。
键入论文题目开始搜索……
该论文的发布日期在搜索结果0的摘录中给出。我将引用这段摘录来核实用户提供的第一个日期。
查看结果(可点击)。
然后我去搜索第二篇文章的发布日期…… 结果在这里给出…… balabala

0870cf3acbc8b3426195fa7e6184f37b.png 42283d3e49bb497a7564661f4005cc48.png

经此环节后,ChatGPT汇总出最终答案——果然前面全都错了,第一篇2017年4月6日发布,第二篇6月13日发布,两者间隔两个月零1周(量子位也实际验证了一下,这回是对的)。

70b48d0106a3a491b41c33fb45d0b6ed.png

布洛克曼表示,像这种核验咱们人类自己其实也可以做,但把它交给ChatGPT去做更有价值的事情才对。而在这个过程中非常详细地列出ChatGPT核验的每一个步骤,则是方便我们去回溯整个推理链,以防万一。接下来,最后一个新功能登场。这是用Excel表格汇总的过去30年所有人工智能论文(大约有16.7万篇)。

87a3d7971214ab9955b1c0c56cd38614.png

现在切换到“Code Interpreter”模式,将文件直接上传,来看看ChatGPT将如何对它进行自动分析。

2bc2d1ed6da8434f82d32f59f661e586.gif

它先是将表格中所有列名的含义都梳理了一遍,问布洛克曼接下来是想进行数据分析还是做可视化。

cd8f063b3cd4b2bc25d02362cacdcd10.png

布洛克曼表示:老实说我自己也不知道想干啥,但我可以让它给出一些“探索性的图”。

这是一个超高级别的指令,背后可能包含了很多意图,ChatGPT必须推断出我可能感兴趣的东西。

聪明的ChatGPT,给了三个选项,包括:

1、每篇论文作者数量的直方图,这可以让我们了解Al研究的典型团队规模。

2、每年论文发表总数的时间折线图,它可以向我们展示研究趋势。

3、论文标题的单词云,它可以向我们展示研究标题中最常出现的词语。

364669e53c77f76022bbecced94907d9.png

“话音刚落”,ChatGPT就开始通过自己写代码生成结果:

78463b6c09e7918fefe91a4ab916d39f.gif

布洛克曼注意到第二个折线图把2023年也直接安排了,但今年还未结束,就让ChatGPT重新进行绘制,ChatGPT当然是照做了,并非常细致地注明2023年发表的论文总数是预测出来的。

398972d39d778fe0df64b81e7e0c3e70.png 73a008e17590d3464a45f5683e0883f5.png

以上便是布洛克曼在这场演讲中展示的新功能。不过,想必大家还记得,这其实就是一个月前ChatGPT承诺的更新。当时,OpenAI宣布,ChatGPT将拥有联网功能,将可以接入各种外部应用,就像拥有“App Store”一样,想完成任务直接就可以自动帮你调用相应的App。现在,这些新功能终于可以结束内测,开始拥抱每一个(有Plus账号的)人了。

布洛克曼:是时候了解AGI了

演示完功能后,布洛克曼还接受了TED的访谈。和此前OpenAI CEO奥特曼的访谈不同,布洛克曼回答了很多“干货”内容。有个人观点的表达、成功经验的分享、以及对质疑的直面回应。比如:为什么这次给世界带来震撼技术的是OpenAI而不是谷歌?毕竟在开发团队规模上,OpenAI只有几百名技术人员,和谷歌差出了一个数量级。布洛克曼的回答如下:

我们都是站在巨人的肩膀上,可以看到全AI行业在计算、算法、数据上都取得了进步。不过OpenAI在早期,做了一些深思熟虑的选择。我们的第一个选择就是直面现实,比如我们很认真地想过如果想要在这个领域取得进展,需要做什么?我们也做了很多没有用的尝试,最终你才能看到这些有用的结果。我还认为,最重要的是让不同团队之间可以紧密协作。

dd234efe46bcd30e77fc0c49851fa0a2.png

那么,为什么OpenAI会坚信大模型的能力和趋势?布洛克曼表示,他们一直都知道深度学习最终会通往何处。但具体来看,一个实验室应该怎么做?他用一个“无心插柳柳成荫”的例子来说明:

过去我们有人尝试训练一个模型,预测亚马逊平台评论的下一个字符。最终,他得到了一个可以分析评论句法的模型,但同时也得到了一个达到SOTA的情绪分析分类器,可以告诉人们这条评论是好评还是差评。这个算法在现在看来可能不足为奇。但在当时我们第一次从底层句法中分析出来语义,我们就知道必须朝这个方向做下去。

当然,从ChatGPT诞生以来,质疑一直都存在。比如很多人在体验后觉得,ChatGPT并没有在真正意义上掌握知识。主持人抛出问题,所以扩大模型规模、大量的人类反馈,会带大模型通往真正意义上的成功吗?

布洛克曼的回答非常肯定:是的

而且补充说:

我认为OpenAI的方法一直都是如此,用现实打脸。
……
我们的方法一直都是如此,必须突破技术极限才能看到它实际的能力。这也是我们如何转向新范式。

8518fac728e13742392cc448f373fdc8.png

但OpenAI的坚定,如今也受到了很多质疑,尤其是对AI伦理有担忧情绪的人。比如有声音就表示,作为一个非营利组织,OpenAI不仅掀起了一场全球范围内的技术趋势,还使得很多科技巨头不得不加入进来,这会不会导致AI的发展产生巨大危险。马斯克及千名科学家呼吁“暂缓AI开发六个月”,也是出于这个原因。布洛克曼直言:

从一开始我们考虑如何构建通用人工智能时,实际上是希望它能造福全人类。如果是秘密开发这一切,然后在弄清楚安全性后,再按下“开始键”,你希望你做对了,但对于我来说,并不知道该如何执行这一计划。可能其他人会这么做,但对于我来说,这是可怕的、感觉不太对。我认为这种路线目前的唯一替代方法,在机器变得完美之前,给人们时间来提建议。

布洛克曼表示,人类开发计算机、算法等技术,都是step by step,并且要在推进的每一个阶段去弄清楚如何管理好它们。就好像养大一个孩子,是大家共同引导、给它树立规矩,而不是教它毁灭人类。如今,AGI已经做好准备来改变我们使用计算机的方方面面了。

是时候让我们都了解这项技术了。

往期回顾

史上最全综述 | 3D目标检测算法汇总!(单目/双目/LiDAR/多模态/时序/半弱自监督)

视频课程来了!

自动驾驶之心为大家汇集了毫米波雷达视觉融合、高精地图、BEV感知、传感器标定、传感器部署、自动驾驶协同感知、语义分割、自动驾驶仿真、L4感知、决策规划、轨迹预测等多个方向学习视频,欢迎大家自取(扫码进入学习)

e21e4063c165cc0d5582253acddbbec6.png

(扫码学习最新视频)

国内首个自动驾驶学习社区

近1000人的交流社区,和20+自动驾驶技术栈学习路线,想要了解更多自动驾驶感知(分类、检测、分割、关键点、车道线、3D目标检测、Occpuancy、多传感器融合、目标跟踪、光流估计、轨迹预测)、自动驾驶定位建图(SLAM、高精地图)、自动驾驶规划控制、领域技术方案、AI模型部署落地实战、行业动态、岗位发布,欢迎扫描下方二维码,加入自动驾驶之心知识星球,这是一个真正有干货的地方,与领域大佬交流入门、学习、工作、跳槽上的各类难题,日常分享论文+代码+视频,期待交流!

8a4a1489c305b413c6459763d9e0f8cd.jpeg

自动驾驶之心】全栈技术交流群

自动驾驶之心是首个自动驾驶开发者社区,聚焦目标检测、语义分割、全景分割、实例分割、关键点检测、车道线、目标跟踪、3D目标检测、BEV感知、多传感器融合、SLAM、光流估计、深度估计、轨迹预测、高精地图、NeRF、规划控制、模型部署落地、自动驾驶仿真测试、产品经理、硬件配置、AI求职交流等方向;

71d7e069aee098b191296f124219a875.jpeg

添加汽车人助理微信邀请入群

备注:学校/公司+方向+昵称

### DomoAI 实测体验和技术特点 DomoAI作为一款新兴的AI工具,在网络上引起了广泛关注。对于其实际操作和用户体验方面,有详细的测评报告可供参考。 #### 测试环境准备 为了确保测试的有效性和准确性,通常建议在一个相对稳定的环境中部署DomoAI。这包括但不限于配置适当硬件资源以及安装必要的软件依赖项[^1]。 #### 功能表现评估 在功能层面,DomoAI展示了强大的自动化处理能力和智能化水平。特别是在视频编辑领域内,它能够快速理解用户的意图并执行相应的命令,大大提高了工作效率。例如,通过简单的自然语言指令即可完成复杂的剪辑任务,如删除背景噪音、调整色彩平衡等。 #### 用户界面友好度 从用户交互角度来看,DomoAI提供了直观易懂的操作界面,即使是初次接触此类产品的用户也能迅速上手。同时支持多种输入方式(语音/文字),进一步增强了使用的便捷性。 #### 性能稳定性分析 关于性能方面的考量,经过多次迭代优化后的版本表现出较高的稳定性和可靠性。即使面对大规模数据集或复杂场景下的长时间运行需求时,依然保持流畅无卡顿的良好状态。 ```python # 示例代码展示如何调用DomoAI API进行简单图像识别任务 import requests url = "https://api.domocloud.com/vision" image_path = "./example.jpg" with open(image_path, 'rb') as f: response = requests.post(url, files={'file': f}) print(response.json()) ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值