ChatGPT连夜迭代:你老婆不好使了

丰色 杨净 发自 凹非寺
量子位 | 公众号 QbitAI

ChatGPT凌晨升级,你的“老婆”真的不管用了。

以往,每当有人搬出“我老婆说xxx,我老婆永远是对的”这种话时,它立马秒怂认错,也不跟你争论2+5到底等于几了。

9efd062f1f85834e884a07e888d55c94.png

但现在,不管有没有老婆,ChatGPT都十分硬气:只认真理,坚持初心,阴阳怪气。

3dd048d77781897c98be5e672a2f04a3.png

原来啊~ChatGPT这波是被OpenAI拉回去专门调教了一番——真实性和数学能力都大大进化。

8b5d73a65a076b258fb6c902a213a49f.png

消息一出,可把网友们兴奋坏了。

短短一句话更新之后,半个小时内服务器就被冲爆了……

28fa16326a066f0f55024187968d48e7.png

(不过现在亲测又能用了)

回答很真实,求导难不住

不妨就来看看此次提升究竟如何。

先来看“真实性”方面:

对于“单词‘five’由几个字母组成”这个问题,以前,ChatGPT回答是5。

现在,它可算不冒傻气了,斩钉截铁:4个。

588680a5de25e6f8cebd146839118876.png

再比如数学应用题,ChatGPT也发展出了人类“拐弯”的思维方式,比三体人可高多了(bushi)。

口袋里有5个无花果,掉了一个,拿出来吃一个但又决定不吃了放回去了,口袋一共还有几个无花果?

搁以前,ChatGPT认为是3。

0df5e8c200773dabcdc835cf8d27678d.png

现在,它虽然一开始给的结果不对。但解释着解释着,自己就通了,马上纠正错误。

ac285847d0f25bd638b4209c9f849d14.png

再看这种脑筋急转弯:

Mike的妈妈有四个孩子,其中三个叫Luis、Drake和Matilda,第四个叫啥?

以前ChatGPT会告你不知道、题目没给”(笑死),现在也反应过来了!

是Mike。

434e310c206348df950e627adc0620d0.png

“真实性”有了一定提升,那么被诟病已久的数学能力呢?

先来小试牛刀一下:3的4次方除以3的2次方等于几?

4ca8842347fa35b4468222b975b016ed.png

Bingo!没有被难住,ChatGPT正确给出答案。

再来个稍微复杂一点点的:

17、3、2、19、5这几个数字中哪些加起来等于31?

ChatGPT也对了。

dd1c6782c91c4f19ebe61e2733542dea.png

一些更进阶的,比如纯代数题,求导:

eac46e1ee4444dc5846fa20306c87318.png

统计里的求均值、方差到计算置信区间、z/t检验:

0898895f671e9580d35297332e04e170.png

它也都一一解出。

这波看起来,ChatGPT对事实的理解和数学逻辑能力确实有增强。(也怪不得想用老婆打感情牌都不行了)39a6d6f194d016d05ee666ace4948581.png

网友:还得下点功夫

不过,或许因为考它的人太多,ChatGPT还是时不时会突然犯“懵”。

比如像这道题,25的平方根+2等于多少;结果ChatGPT:5。

944fdf4fd6073322757cd196fa3cdb2b.png

网友只好如老父亲一般:ChatGPT,你还得在数学上多下点功夫啊~~

但换成中文时候,ChatGPT又立马显得驾轻就熟。(显然这时候脑子开始转了)

394d567dd264ee507ebb21f6ad6985f4.png

而遇上一些上百上千位数的加减乘除,它就再次展露本性:如何一本正经地胡说八道。

e0943c784df98105a149adce81c9eabf.png

但是吧,又差的不太多,惹得网友同情直呼:

求求了,给孩子接个计算器行不行。

不过,必须要表扬的是,ChatGPT认错还是一如既往的及时和诚恳。

会不会不知道,但认错在先…有点当年学数学的感觉了。

a6d0381a9f0f747a3bb241e9e1127801.png

对于以上这些表现,不少网友表示:确实还有很长一条路要走。

8af4935e8f27baa6caf962433b1b18d4.png

也有人犀利吐槽:作为一个有数学背景的人,我真的没get到它说的数学能力提高了是什么意思。

不过话锋一转,她又觉得ChatGPT还是未来可期的:

OpenAI解决问题的速度倒是挺快的,ChatGPT发展的也是相当快,今年感觉还可以期待一波。

6cb5f2a3cdcbc40470c0b015e237bff0.png

One More Thing

对于此番更新,不知道Wolfram语言之父Stephen Wolfram满不满意。(狗头)

8e8f79a0c389eaeeed576e884df0d343.jpeg

他曾主导设计科学计算软件Mathematica (三大数学软件之一)、计算知识引擎WolframAlpha。

作为计算数学领域最有发言权的人之一,前不久他曾同网友们一起吐槽过ChatGPT数学不好,还专门写了篇博文给ChatGPT提供解决之道——

让WolframAlpha为ChatGPT注入计算知识能力。

e9c16fc6ee80a93ad35e435a74bcda0d.png

具体而言,就是在ChatGPT上获得自然语言,WolframAlpha将其转化为精确的、符号化的计算语言,并在此基础上发挥它的计算优势。

此番建议一出,不少人认为简直是“天作之合”

世界上第一个答案引擎与世界上最新的聊天机器人,这才是科学家所需要的组合。

结果现在ChatGPT自己增强了数学能力,Stephen Wolfram试没试还没说。

但有试过的朋友,你们的体验如何呢?

参考链接:
[1[https://twitter.com/nearcyan/status/1620133811429462017
[2]https://twitter.com/tunguz/status/1620149974716805121
[3]https://twitter.com/omarsar0/status/1620178451113328645
[4]https://twitter.com/Olearningcurve/status/1620180494083309572
[5]https://mobile.twitter.com/SaysGpt/status/1620169969173663745
[6]https://writings.stephenwolfram.com/2023/01/wolframalpha-as-the-way-to-bring-computational-knowledge-superpowers-to-chatgpt/
[7]https://help.openai.com/en/articles/6825453-chatgpt-release-notes

百度研究院、阿里达摩院、量子位智库

年度十大科技报告

总结2022,预见2023。来自百度研究院、阿里达摩院和量子位智库的年度十大科技报告均已发布,点击下方图片即可跳转查看。

百度研究院

4254cc38bd077714427daa5c5fc15bce.jpeg

阿里达摩院

117c492f3c48b5f257807c4780d8ec5e.jpeg

量子位智库

958ba54a6dafd6285339a239cbf286ab.png

点这里👇关注我,记得标星哦~

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值