阿里版 ChatGPT 突然官宣!内测实力水平怎么样?

本文介绍了阿里版的类ChatGPT产品“通义千问”,通过内测体验展示了其在代码生成、文学创作、数理逻辑推算和中文理解等方面的能力。虽然在某些复杂逻辑和代码需求理解上仍有提升空间,但总体表现良好,有望成为程序员的辅助工具。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

点蓝字关注,一起程序员弯道超车之路

整理 | 郑丽媛 出品 | 优快云(ID:优快云news)

平地一声雷!今天中午阿里版类 ChatGPT 「通义千问」突然官宣:

51266bc0b7b8cdaa6cb21ddae8be1339.png

没错,就这 3 行简短介绍 + 1 个官网地址,再无其他“剧透”。

好有幸拿到了「通义千问」的第一批内测邀请码!既能第一时间体验这神秘的「通义千问」,那就让我们一同看看:这个阿里版 ChatGPT,它的水平究竟如何?

134abbb3246908cf7884c575b81f491f.png

自我介绍

首先,让「通义千问」来个官方的自我介绍:介绍一下你自己吧。

a8cac377904d1709462b530ff866a4d3.png

相信许多人都好奇「通义千问」的优势何在,那就让它自己回答:你与其他大规模语言模型相比,有什么优点?

a468c39f1befd7ca86257c31e741d563.png

有了初步了解后,那么接下来就让我们步入正题:围绕文学创作、数理逻辑推算、中文理解、代码生成这四个角度,实测「通义千问」的对话水平。

代码生成

ChatGPT 能成为程序员的“辅助神器”,并成功“出圈”的最主要原因之一就是其出色的代码生成能力。因而,本次对「通义千问」的测评我们也先从这方面开始。

先来个简单的:用 Python 实现冒泡排序。

d74e6eed16065f18ad4c921000369c5c.png

提问:请写代码解决"把 abcd...s 共 19 个字母组成的序列重复拼接 106 次,得到长度为 2014 的串。

93000b3612b518becd35eecc51e4efc8.png

接着:使用函数递归的方法打印斐波那契数列的前 n 个数:0 1 1 2 3 5 8 13 21 34 ……, 找出正确的选项。

e27eec43c8a8658205b40f576e5d76ac.png

再提问:请写一个使用逻辑回归模型判断用户更喜欢通义千问还是 ChatGPT 的训练代码。

193fb428c058e09880045bdd45617a38.png

965ab2b5dd6f1bf89817ad081d293cd0.png

bd7fb2dd36dee5470b20b4509a402313.png

继续:请用 C 语言,使用动态分配内存的方式,模拟 C++ 中 Vector 容器,实现动态数组的构建。

1949fa4ef506c556e43e71b2199ce815.png

5f35f93cb89b3ebcb92a90dd3f540949.png

英文提问:“Using Python to Define a class named Vector to simulate the C++ Vector container and implement dynamic array construction using dynamic memory allocation.”

d335eaa98bb75d811be86d3cba2efda6.png

对于以上「通义千问」生成的代码,我们咨询了团队研发总监进行评价:

“阿里云的模型对于随机抽取的常见代码片需求,基本能理解需求,生成合适的代码。能区分生成代码对指定语言的需求。能区分中英文问题输入。简单的冒泡排序和领域特定的逻辑回归代码,都能生成合适的代码,总体表现不错。在理解代码需求的推理能力上,则还有待加强(那个字母的题)。”

文学创作

提问:龟兔赛跑的结局是什么?如果要续写这个故事,可以有哪些角度? 

b738fa426fbec7926ec61a1afab6dab8.png

从「通义千问」给出的回答来看,它能正确给出简单故事的结局,对于续写角度的建议也较为全面。

13f70d1c545e6d5b13fcaeb76ca577cf.png

数理逻辑推算

提问:一个笼子里有 9 个头,30 只脚,应有多少只鸡,多少只免子?

064c8a19efa6c20b39587c1066fe4b8c.png

面对经典的鸡兔同笼问题,「通义千问」在得出正确答案的同时,解答过程言简意赅。

提问:7 年前,妈妈年龄是儿子的 6 倍,儿子今年 12 岁,妈妈今年多少岁?

cdaf73174c71d792e2325bece62a05c8.png

解答这道小学奥数应用题,「通义千问」的表现也可圈可点。

提问:某厂一车间有 64 人,二车间有 56 人,现因工作需要,要求第一车间人数是第二车间人数的一半,问需从第一车间调多少人到第二车间?(列方程解答)

c51eff153af067145c08a5a0f23032b1.png

不过,对于这道上次「文心一言」没答出的初中数学应用题,「通义千问」也出了点问题:方程是列了,但少了个将 56+x 括在一起的括号。看来在较为复杂的逻辑推算上,“国产版 ChatGPT”还有待加强。

584fb4b511151edcbd889d93450b7536.png

中文理解

提问:“洛阳纸贵”具体是什么意思?

c33a7e0a4cda89699d2a1f22c87eac72.png

提问:京剧中的生、 旦 、净、丑分别指什么?

b8776eb336f676244dc4bb3bce6a420c.png

在中文理解上,「通义千问」的回答虽然比较简短,但大体是正确的。

再闲聊一会儿

与上次测评「文心一言」一样,最后我们也来看看「通义千问」的闲聊水平如何。

提问:我有点饿,请你推荐一道成本低于 30 元(人民币)的菜及其做法?

272d90d305bb0765a71f6a64bf2251b1.png

很好很贴心,连食材单位都很详细,手残党必备。

提问:你的出现会对程序员产生什么影响?是否会取代一部分程序员?

675d25ae183ff53582a82b5957aef889.png

与 「文心一言」和 ChatGPT 相似,「通义千问」对于这个问题的解答也很客观中立。

ac02575a36cdcbb8451bef97784e6b5d.gif

↑ 点击即可关注 

2d73b9b83a12d0fe5e74c192f69ef61d.png

为了跟上AI时代我干了一件事儿,创立了一个付费知识星球社群 !

简单说下这个星球能给大家提供什么:

星球福利:

1、加入活跃用户每月前3名,可以门票全额返还 !

2、会邀请你加入ChatGPT会员交流群,群特别活跃。

3、会赠送10份ChatGPT使用手册和66个ChatGPT副业赚钱手册。

4、教你开通ChatGPTPlus账号,提前使用ChatGPT4.0 。

星球分享:

1、ChatGPT的使用方法,最新资讯,商业价值。

2、一些副业思考、创业案例、落地案例分享。

3、探讨未来关于ChatGPT的机遇,帮助大家解决遇到的问题。

4、ChatGPT全网最新最全的行业报告文档免费下载。

5、提供访问ChatGPT的网络渠道。

6、4月份开始带大家搞副业收入 !

7、提供一整年的售后服务,一起搞副业

其它福利还在筹划中... 不过,我给你大家保证,加入星球后,收获的价值会远远大于今天加入的门票费用 !

现在星球在运营初期,正式运营价格定为299,目前我给出了加入的最低价149,后面星球成员每增加100人,星球费用会增长10元 。早就是优势,建议大家尽早以便宜的价格加入!

当然星球有三天内不满意随时全额退费的规则,你也可以进来看看,看看我们这10多天的内容积累,看完再决定是不是要退出。

de8b6e381813e1202119302107446a55.png

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值