ChatGPT死活不认27能被3整除,网友:不是说AI要统治世界了吗?

部署运行你感兴趣的模型镜像
Alex 羿阁 发自 凹非寺
量子位 | 公众号 QbitAI

让众人疯狂的网红AI ChatGPT,原来也有明显的短板?

一段“网友调教这只AI”的聊天记录,在网上传开了。

可以看到,AI起初居然说27是个质数。

c679d0d090f8fcaf64f0116a2ea74496.png

在网友向其提出质疑后,AI仍嘴硬称“27不能被3整”。

bdd02fd7e6914ff018163e0f640ce22f.png

网友不得不和AI“大战几百回合”,最后在人类锲而不舍的教导下,AI才终于终于低头认错。

973f163572cffcc71cf66af9f9d4351e.png

上述图源:微博@沙雕文案 援引网友空间截图

有一说一,AI的认错态度倒是很好。

fdf346df3cddcb6733a06aefb5d15219.jpeg

有围观者看完后调侃:AI不是都要统治世界了吗,怎么会输给一道简单的数学题?

6fb4499aa75ccb67007a15a3aecbebee.jpeg

不过,也有很多人为ChatGPT说话:这么坦诚的认错态度,不比某些人强多了b37674b17f8259a53ab43f46a02213e9.png

6528f037445d7c0e4dfc2a492c5d7e46.jpeg
a552e7264e385b594779a6503a7011a8.jpeg

数学水平拉胯,还贼固执

具体事情是这样的:

网友在和ChatGPT互动的过程中发现,这只AI数学水平过于拉胯,连27是不是质数这种简单问题都能搞错——而且还是在知道质数定义的情况下……

1409aeceb4a4eded97e4e96e0fa0cbc4.jpeg

于是网友让ChatGPT证明它给出的结论,没想到,AI居然说27不能被3整除。

网友表示无语,但还是耐着性子又问了一遍,结果AI依然嘴硬,偏把9说成是9.0。

无奈,网友只能搬出代码,试着用Python来教会AI。

结果AI还真学会了!而且人家还主动承认了刚才的错误。

21a1354324383a09ab691d72b4c2f26d.png

有意思的是,我们刚才也去问了ChatGPT“27是不是质数”,发现它已经改过来了。

79ab60d88504e21ba2aa28041833b5a9.png

然后我们又拿了几个数字去问AI,结果在这一回合中,它都正确地判断了一个数到底是不是质数。

9efc15296ef6d1404a166d782cc0b214.png

不过仔细一看,AI并没提到35能被7整除,于是我们又专门问了一遍。然鹅……

b89ed393b69cfe55e700dba63884a919.png

这岂不是一本正经地胡说八道嘛?

于是我们也只好搬出Python教教它,但这回,连python似乎也没能让AI承认自己的错误……

86dbbbbe5cd529b3b20a5c8b05607df3.png

所以这只AI为啥算术水平如此堪忧,而且还如此固执?

e631af0d60cfdaa4898104ccb466c587.jpeg

其中一个重要的原因就是,ChatGPT是个语言大模型,根据Open AI的GPT-3.5的模型微调而成,它擅长逻辑推理,但并不能执行标准的计算机算法。

而且与搜索引擎不同,它目前也没有网页浏览功能,无法调用在线计算器。

此前,ChatGPT其实已经向用户坦言,它不懂算术。两位数的乘法或许还凑乎,但遇到三位数的乘法,人家直接不干了。

e94aedafc7b208b51ff6a123b473db10.png

我们也去问了一遍,现在AI到是直接给了个答案,不过是错的。(正确答案为186524)

16f94ded667168019b91c4ecb34d31b6.png

另外,ChatGPT一般不会根据用户的反馈来纠正自己的答案,但如果用户提出了额外的信息,有时也能辅助AI优化答案。

290f4ffc5db0eb2e0b7b384d7b16f80d.png

所以,我们暂时没有成功地“教育”AI,大概也许可能是运气不太好……

除了数学其他都很全能

尽管ChatGPT有时会展现出“人工智障”的一面,但不得不说,大多数时候它的表现还是很优秀的。

比如,哥伦比亚大学教授、谷歌工程师Kenneth Goodman就分享,ChatGPT已经做好成为律师的准备了!

律师执业考试中,ChatGPT的正确率高达70%(35/50)。

bf39e743b1b97458e4a813f74ae8b398.jpeg
b25c65006408b93b10995205b4b2da39.jpeg

不仅是法律方面,Goodman还让ChatGPT参加了其他不同领域的各种考试,都取得了很高的成绩。

包括美国医师执照考试(USMLE),拿掉其中的图像选择题后,ChatGPT同样做到了70%的正确率。

f04c141b03a903eeb40fdce982ecefc7.png

为了防止ChatGPT的训练数据中包含这些题目,Goodman还特意选取了纽约州2022年8月最新化学注册考试

去除5个图片选择题,ChatGPT的正确率为77.7%(35/45)。

edcef4e1a575e562f8d8e13cd40b34ee.png

同样批次的英语考试中,ChatGPT的正确率甚至达到了91.6%(22/24)

86e97e5a044091cede1b08a5bd716035.png

有网友已经开始预测,或许我们每个人都将拥有自己的律师AI了,咨询律师的费用也会大大下降。接下来就是医生AI、营养师AI……

0fd8986d52da2dce344c5ae85693b0e0.png

怎么样,你看好ChatGPT的未来应用吗?(或者你有让它学好数学的建议吗?47044ea1a0bcfc2e20a0a1075e0d0619.png

参考链接:
[1]https://weibo.com/7095186006/Mj6LVF0zS#comment
[2]https://twitter.com/TonyZador/status/1601316732689604608
[3]https://twitter.com/pythonprimes/status/1601664776194912256

量子位「MEET2023智能未来大会」

倒计时2日,即将线上直播

326b951525382d72cb30766a077fc78c.jpeg

点这里关注我 👇 记得标星噢 ~

您可能感兴趣的与本文相关的镜像

TensorFlow-v2.9

TensorFlow-v2.9

TensorFlow

TensorFlow 是由Google Brain 团队开发的开源机器学习框架,广泛应用于深度学习研究和生产环境。 它提供了一个灵活的平台,用于构建和训练各种机器学习模型

评论 12
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值