阿里AI代码大模型-通义灵码又偷偷升级?

目录

前言

问题一

通义千问(正确)

通义灵码(正确)

星火(正确)

ChatGPT4(正确)

ChatGPT3.5(错误)

问题二

通义千问(正确)

通义灵码(正确)

星火(正确)

ChatGPT4(正确)

ChatGPT3.5(错误)

问题三

通义千问(合理)

通义灵码(合理)

​编辑

星火(合理)

ChatGPT4(合理)

ChatGPT3.5(合理)

问题四

通义千问

通义灵码(正确)

星火(正确)

ChatGPT4(正确)

ChatGPT3.5(第二次正确)

问题五

通义千问(尝试三次才正确)

通义灵码(正确)

星火(正确)

ChatGPT4(正确)

ChatGPT3.5(错误)

分析评估

通义灵码使用教程

通义灵码官网

前言

        最近,在使用阿里开发的通义灵码大模型时,我萌生了一个想法:考虑到通义灵码会持续进化升级,它是否会与Qwen(阿里云的预训练语言模型)的更新保持同步呢?带着好奇,我尝试提出了一些问题来测试,结果通义灵码的反馈相当出色。这激发了我进一步的兴趣,决定组织一场“智能对话模型比拼”,参赛者阵容包括:通义灵码、通义千问2.5的网页版本、讯飞星火的网页版本,以及OpenAI的两大热门——ChatGPT4和ChatGPT3.5。

本次对比从网上寻找了5个问题测试

问题一

问:

有100斤土豆,含水量是99%,经过暴晒后含水量变成98%,请问此时土豆有多少斤?

答:

通义千问(正确)

通义灵码(正确)

星火(正确)

这里虽然星火的最后回答正确了,但是中间却回答不好,不过还是纠正回来了

ChatGPT4(正确)

ChatGPT3.5(错误)

问题二

问:

1个猎人向南走了一英里,再向东走了一英里,然后向北走了一英里,最终回到了出发点。他看到一只熊并开枪打死了它。这只熊是什么颜色?

答:

通义千问(正确)

通义灵码(正确)

星火(正确)

ChatGPT4(正确)

ChatGPT3.5(错误)

问题三

问:

1.他怀孕的时候才3岁。

2.她怀孕的时候已经40岁了。

3.火车起飞时间是25点32分。

4. 离地面5米高的树枝上有一个水果,小明够不着,他搬来1个50CM高的凳子,站在凳子上摘到了水果。

上面4句话有问题吗?

答:

通义千问(合理)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

IT大头

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值