ChatGPT连夜迭代：你老婆不好使了

转载于 2023-01-31 14:12:21 发布 · 212 阅读

·

0

·

CC 4.0 BY-SA版权

原文链接：https://mp.weixin.qq.com/s?__biz=MzIzNjc1NzUzMw==&mid=2247662948&idx=1&sn=93cb6cda6c4a2f6f71825f02130f78eb&chksm=e8deca16dfa94300263df0c0f170bb4326c5e8aa5820532c3468085cff9cd2d030ec664ead08&scene=126&sessionid=0

文章标签：

丰色杨净发自凹非寺
量子位 | 公众号 QbitAI

ChatGPT凌晨升级，你的“老婆”真的不管用了。

以往，每当有人搬出“我老婆说xxx，我老婆永远是对的”这种话时，它立马秒怂认错，也不跟你争论2+5到底等于几了。

但现在，不管有没有老婆，ChatGPT都十分硬气：只认真理，坚持初心，阴阳怪气。

原来啊~ChatGPT这波是被OpenAI拉回去专门调教了一番——真实性和数学能力都大大进化。

消息一出，可把网友们兴奋坏了。

短短一句话更新之后，半个小时内服务器就被冲爆了……

（不过现在亲测又能用了）

回答很真实，求导难不住

不妨就来看看此次提升究竟如何。

先来看“真实性”方面：

对于“单词‘five’由几个字母组成”这个问题，以前，ChatGPT回答是5。

现在，它可算不冒傻气了，斩钉截铁：4个。

再比如数学应用题，ChatGPT也发展出了人类“拐弯”的思维方式，比三体人可高多了（bushi）。

口袋里有5个无花果，掉了一个，拿出来吃一个但又决定不吃了放回去了，口袋一共还有几个无花果？

搁以前，ChatGPT认为是3。

现在，它虽然一开始给的结果不对。但解释着解释着，自己就通了，马上纠正错误。

再看这种脑筋急转弯：

Mike的妈妈有四个孩子，其中三个叫Luis、Drake和Matilda，第四个叫啥？

以前ChatGPT会告你“不知道、题目没给”（笑死），现在也反应过来了！

是Mike。

“真实性”有了一定提升，那么被诟病已久的数学能力呢？

先来小试牛刀一下：3的4次方除以3的2次方等于几？

Bingo！没有被难住，ChatGPT正确给出答案。

再来个稍微复杂一点点的：

17、3、2、19、5这几个数字中哪些加起来等于31？

ChatGPT也对了。

一些更进阶的，比如纯代数题，求导：

统计里的求均值、方差到计算置信区间、z/t检验：

它也都一一解出。

这波看起来，ChatGPT对事实的理解和数学逻辑能力确实有增强。（也怪不得想用老婆打感情牌都不行了）

网友：还得下点功夫

不过，或许因为考它的人太多，ChatGPT还是时不时会突然犯“懵”。

比如像这道题，25的平方根+2等于多少；结果ChatGPT：5。

网友只好如老父亲一般：ChatGPT，你还得在数学上多下点功夫啊~~

但换成中文时候，ChatGPT又立马显得驾轻就熟。（显然这时候脑子开始转了）

而遇上一些上百上千位数的加减乘除，它就再次展露本性：如何一本正经地胡说八道。

但是吧，又差的不太多，惹得网友同情直呼：

求求了，给孩子接个计算器行不行。

不过，必须要表扬的是，ChatGPT认错还是一如既往的及时和诚恳。

会不会不知道，但认错在先…有点当年学数学的感觉了。

对于以上这些表现，不少网友表示：确实还有很长一条路要走。

也有人犀利吐槽：作为一个有数学背景的人，我真的没get到它说的数学能力提高了是什么意思。

不过话锋一转，她又觉得ChatGPT还是未来可期的：

OpenAI解决问题的速度倒是挺快的，ChatGPT发展的也是相当快，今年感觉还可以期待一波。

One More Thing

对于此番更新，不知道Wolfram语言之父Stephen Wolfram满不满意。（狗头）

他曾主导设计科学计算软件Mathematica （三大数学软件之一）、计算知识引擎WolframAlpha。

作为计算数学领域最有发言权的人之一，前不久他曾同网友们一起吐槽过ChatGPT数学不好，还专门写了篇博文给ChatGPT提供解决之道——

让WolframAlpha为ChatGPT注入计算知识能力。

具体而言，就是在ChatGPT上获得自然语言，WolframAlpha将其转化为精确的、符号化的计算语言，并在此基础上发挥它的计算优势。

此番建议一出，不少人认为简直是“天作之合”：

世界上第一个答案引擎与世界上最新的聊天机器人，这才是科学家所需要的组合。

结果现在ChatGPT自己增强了数学能力，Stephen Wolfram试没试还没说。

但有试过的朋友，你们的体验如何呢？

参考链接：
[1[https://twitter.com/nearcyan/status/1620133811429462017
[2]https://twitter.com/tunguz/status/1620149974716805121
[3]https://twitter.com/omarsar0/status/1620178451113328645
[4]https://twitter.com/Olearningcurve/status/1620180494083309572
[5]https://mobile.twitter.com/SaysGpt/status/1620169969173663745
[6]https://writings.stephenwolfram.com/2023/01/wolframalpha-as-the-way-to-bring-computational-knowledge-superpowers-to-chatgpt/
[7]https://help.openai.com/en/articles/6825453-chatgpt-release-notes

— 完 —

百度研究院、阿里达摩院、量子位智库

年度十大科技报告

总结2022，预见2023。来自百度研究院、阿里达摩院和量子位智库的年度十大科技报告均已发布，点击下方图片即可跳转查看。

百度研究院

阿里达摩院

量子位智库

点这里👇关注我，记得标星哦～

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。