文心一言 vs ChatGPT!相同 10 问,结果出乎意料

文章通过多个场景的问答对比,展示了文心一言在文学创作、中文理解等方面的优势,以及ChatGPT在数理逻辑、编程解答上的强项。两者在商业文案和多模态生成方面各有千秋,但在某些特定领域如中文文化知识和代码编写上,文心一言仍有提升空间。此外,讨论了它们对程序员行业的影响,均认为不会完全取代人类。

1、文学创作

提问:龟兔赛跑的结局是什么?如果要续写这个故事,可以有哪些角度? 

  • 「文心一言」的回答:

  • ChatGPT 的回答:

整体而言,在这个问题中「文心一言」和 ChatGPT 不相上下,「文心一言」以更全面的回答略胜一筹。

2、商业文案创作

提问:帮我开发的智能扫地机器人起个名字,再写一篇600字左右的商业宣传文案,用于推广这款产品。

  • 「文心一言」的回答:

  • ChatGPT 的回答:

在这个问题中,相比 ChatGPT,「文心一言」的表现还需要再进步一些。

3、数理逻辑推算

提问:某厂一车间有64人,二车间有56人.现因工作需要,要求第一车间人数是第二车间人数的一半.问需从第一车间调多少人到第二车间?(列方程解答)

  • 「文心一言」的回答:

  • ChatGPT 的回答:

就这道题而言,得出正确答案的 ChatGPT 比「文心一言」表现得更好。 

4、中文理解

提问:京剧中的生、 旦 、净、丑分别指什么? 

  • 「文心一言」的回答:

  • ChatGPT 的回答:

对于中国文化特有的词汇,相较于 ChatGPT,「文心一言」在这方面要更准确一些。 

5、多模态生成

提问:帮我画一只可爱的黄色大猫

  • 「文心一言」的回答:

由于目前 ChatGPT 没有直接生成图片的功能,因此只有「文心一言」成功生成了上面的图片,整体来看效果还不错。不过,ChatGPT 有了 GPT-4 的加持后,也可以根据草图生成一个网站。所以总体来说,二者也算是各有千秋。

6、附加题:编写代码

提问:请写一个使用逻辑回归模型判断用户更喜欢文心一言还是chatGPT的训练代码

  • 「文心一言」的回答:

  • ChatGPT 的回答:

1. ChatGPT 准确生成了逻辑回归模型模版代码,解决的是目标问题。
2. 「文心一言」虽然生成了代码,但是生成的是图深度优先搜索(Deep First Search)代码,并不是目标问题解法代码。

正如百度在发布会上所说,「文心一言」的代码能力还需加强,而 ChatGPT 以擅长编码“出圈”果然不无道理。

7、最后,再闲聊一会儿

提问:给我讲个笑话吧

  • 「文心一言」的回答:

  • ChatGPT 的回答:

……怎么说呢,「文心一言」和 ChatGPT 可能都不擅长讲笑话,都不是很好笑。

提问:我有点饿,请你推荐一道成本低于 30 元(人民币)的菜及其做法?

  • 「文心一言」的回答:

  • ChatGPT 的回答:

「文心一言」推荐了三道菜,ChatGPT 则将做菜步骤进行了详细分解,那么你更喜欢谁的回答呢? 

提问:你的出现会对程序员产生什么影响?是否会取代一部分程序员? 

  • 「文心一言」的回答:

  • ChatGPT 的回答:

提问:你认为,你和ChatGPT/「文心一言」谁更厉害?

  • 「文心一言」的回答:

  • ChatGPT 的回答:

在这个问题上,ChatGPT 和「文心一言」很有默契,表现得都很谦逊。

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值