时间:2023/12/06
由于各个AI大厂会不断优化ai模型,收集用户反馈并更新不足点,因此本文章仅对当前ai模型能力进行对比分析。
一、拓展能力对比
该项目针对AI模型,在定义了一个虚拟人物后,是否能够拓展既定的发言内容,拥有更强大的语言编造能力。
通义千问:
上图可以看出,通义千问在被问及非设定内容,并且该问题属于开放性问题时,始终只重复一类回答,回答随机性不足,且回答较为僵硬。
文心一言:
当文心一言面对这种开放性问题时,会合理的编造一个回答,但如果重复问相同的问题,可能会给出不同的答案,给人一种撕裂感。随机性有余,但语境分析仍然有待提高。
二、语言能力对比
论中文语言处理,文心是要略优于通义千问的,但两者差距并不大,也仅仅只是表述方向上的不同
通义千问:
文心一言:
本来只是对比语言处理能力,但偶然发现,通义千问在上下文处理时,不会盲目遵循用户的最新指令,懂得拒绝,只有清除上下文,才会回答相应问题,这在某些业务情景中,这种能力可能会比其他能力更受欢迎。
三、专项能力对比
根据前两项对比,大致也能看出,通义千问比文心一言要更加严谨,当然也更加死板。文心一言更加灵活,但也略有些“口无遮拦”。
据此,在对比专项能力前,大概也能猜出,在专项能力上,可能通义千问要回答的更优一些。
通义千问:
文心一言:
以上通过两个开发相关的问题举例,文心一言给人的感受是,喜欢在代码处打俭省,当然,文心一言在回答的字数上可能略多,在一些概念上可能解释的会更详细一些。这点博主也在日常工作中有所体会,文心一言在专项知识上的回答总是差点意思。
四、总结
综上,可以根据自身具体的需求去使用两种AI模型,通义千问更适合答疑,回答较为严谨,而文心一言更适合知识普及和聊天,但无论哪种模型,在采纳建议的时候,都需要自己辨别内容的真实度。
AI的回答大都是数年前学习的数据,并非实时学习,因此部分回答可能早已过时,或者该回答是AI编造的答案。