阿里已经积累了很多模型能力,是国内可实用模型最多的厂商没有之一,这次也终于从后台走到前端了。

正如大佬所说的一样Qwen模型在海外凭实力杀出重围!!!!
好奇这种AI模型除了中美,还有其他国家的企业能上桌吗,日韩英法?好像几乎没有存在感,如果真的没有,那又是标准的中美断崖领先其他
欧洲有个大模型,不过排名不靠前。
目前看确实还是中美。我觉得是因为互联网巨头主要集中在中美,互联网公司孵化大模型有先天优势吧
当它的词库里有成千上万的敏感词,有着独特的价值观,它就必然站不上AI第一梯队,因为AI需要输入的是逻辑,是前沿的科学知识,它才能够输出有真正被你我所用。
下图是业界最公认的AI能力榜单LMArena。千问是唯一一个进入前十的中国模型。

不过有一点值得说的是:用chatGPT你可以去问建国后一些历史事件前因后果和知名人物的想法意图立场,虽然答案可能不见得是对,至于千问还是聊聊古代史和世界史吧
应该是有AI监管机制,当AI在进行思考时,他的思考逻辑被另一个AI进行监督,如果监督AI判断思考逻辑踩线了就立马取消思考停止回答,所以现在的AI审核不在像传统审核那样根据敏感词来判断,而是能够解读出评论回复想表达意思判断是否踩线,除非指桑骂魁阴阳怪气用黑话定制术语以至于一般人不能理解真实意思才通过AI审核吧
我试过不少AI 功能了,这款在生活服务上,更便捷,相当于一个应用调动支付宝、飞猪、淘宝、饿了么、钉钉、高德地图等平台的功能,路线推荐都更精准一些!
ChatGPT 目前的商业模式就不会挣钱。阿里即使不说技术就 开源AI + 云服务器这个商业模式本身就比 ChatGPT 靠谱,现在的 to C 也是为了展示技术来推销云服务这套逻辑。

ChatGPT 这种靠全世界订阅都没办法实现盈利最后一定也会走上开源 + 云服务器模式,可能开源的方式不太一样例如允许内网部署这样的。
Qwen是很强。我的课题是“赛博科学家”这类的。其中一个环节是需要和人交流,解决办法是嵌套LLMs来推理和把自然语言转化成机器语言。我竟然看到业内大牛研究团队测试模型有qwen (deepseek当然也有 chatgpt grok gemini claude就更别说了)。但却是没看有人用过豆包 和 其他国产的。(听说minimax很火 不知道未来会不会有人用)
当它的词库里有成千上万的敏感词,有着独特的价值观,它就必然站不上AI第一梯队,因为AI需要输入的是逻辑,是前沿的科学知识,它才能够输出有真正被你我所用

实践是检验真理的唯一标准,好不好用历史会来评判,我个人认为目前所有的大数据模型都仍然处在数据积累的阶段,远远没有达到完成体。
c端市场看的是产品力而仅仅是模型技术能力,千问能否从豆包手中啃下一口肉还不好说,得看看接下来得一年内,有什么大的动作吧。。。

456

被折叠的 条评论
为什么被折叠?



