新一轮大模型混战！百度亮出2.4万亿参数文心5.0，OpenAI却说：我们不跑分了！

原创于 2025-11-25 09:48:37 发布 · 369 阅读

·

8

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#百度 #人工智能 #ai #科技 #学习 #语言模型 #openAI

『AI先锋杯·14天征文挑战第8期』 10w+人浏览 342人参与

丨技术奇点临近，全球大模型竞赛进入分水岭时刻。

如果一年前的大模型竞赛还是“百模大战”的混战状态，那么2025年末的这场竞争已逐渐分化出截然不同的技术路线与生态策略。

就在11月13日，百度世界大会上，文心5.0以2.4万亿参数的庞大身躯亮相，宣称构建全球首个“原生全模态”模型。
同一天，OpenAI却轻装简行，推出GPT-5.1系列，公然宣称“不跑分不刷榜”，专注“说人话”。
微博旗下的VibeThinker-1.5B则以“小模型挑战巨无霸”的姿态，仅用15亿参数就在某些测试中击败了6710亿参数的DeepSeek R1。

这背后，是全球AI产业对技术路径的深刻分歧：是继续追求规模效应，还是转向实用主义？

01 百度文心5.0：原生全模态的野心

在11月13日的百度世界大会上，文心5.0以2.4万亿参数规模引发业内瞩目。参数规模远超上一代产品，采用超稀疏混合专家架构，有效提升推理效率。

文心5.0的核心定位是“原生全模态”，统一训练语言、图像、视频、音频。这与业界多数多模态模型采用后期融合的方式截然不同。

在实际测试中，文心5.0展现出了强大的多模态理解能力。

丨例如，给它上传一个电影片段，它能精准分析出最紧张的情节，具体到第几秒到第几秒。同时上传一段视频和一段音频，它就能判断视频里是否使用了音频中的音乐，并准确说出使用节点。

在官方基准测试中，文心5.0 Preview在语言、视觉理解、音频理解、视觉生成多维度表现突出，其语言与多模态理解能力与Gemini-2.5-Pro、GPT-5-High等模型持平。

更早之前，文心5.0 Preview曾在LMArena大模型竞技场文本排行榜上得分1432，与GPT-4.5-preview、Claude-Opus-4-1等并列全球第二，位居国内第一。

02 OpenAI GPT-5.1：不刷榜只说人话与百度追求参数规模和技术全面性不同，OpenAI在同期发布的GPT-5.1系列选择了截然不同的路线。

GPT-5.1包括两个子模型：

GPT-5.1 Instant面向日常对话和快速响应场景
GPT-5.1 Thinking用于复杂推理和深入问题场景。

一句话概括，简单问题更快速，复杂问题更智能。

OpenAI官方特别强调，GPT-5.1“不跑分不刷榜，主打一个有人设，说人话，更情绪价值”。

GPT-5.1还增强了指令遵循能力。在明确告知只能用六个字回复的前提下，GPT-5.1 Instant能严守规矩，而GPT-5则常常已读乱回。

这一转变也引发了部分争议。有批评指出，OpenAI似乎将大量资源倾注于打磨对话的细腻度，而非拓展模型的认知边界。当用户试图引导其进行深度思辨或跨领域推理时，GPT-5.1往往退回安全区，给出中庸且泛化的回应。

03 微博VibeThinker-1.5B：小模型的逆袭

在各大厂商追逐参数规模的背景下，微博发布的VibeThinker-1.5B却走出了一条“小模型逆袭”的道路。

https://github.com/WeiboAI/VibeThinker

https://huggingface.co/WeiboAI/VibeThinker-1.5B

这个仅有15亿参数的模型，

在多项复杂的数学和编程测试中击败了拥有6710亿参数的DeepSeek R1模型，而后者的体积是前者的400多倍。

训练这个小模型的总成本只有7800美元，而那些大模型的训练成本动辄数十万美元。VibeThinker的成功关键在于其创新的训练方法——“频谱到信号原理”训练框架。不追求模型的单次答题准确率，而是优化生成多个不同答案的能力，只要生成的多个答案中至少有一个正确就算成功。

VibeThinker的出现挑战了“大即是好”的简单粗暴思维，降低了AI研究和应用的门槛。

04 百度GenFlow3.0：全球最大通用智能体

除了文心5.0，百度还在百度世界大会上正式发布了GenFlow3.0，活跃用户超2000万，已成为“全球最大通用智能体”。

两大智能体：

Office Agent：是首个真正吃透办公套件的智能体，用户可用简单指令完成Excel复杂计算、Word深度排版等专业操作；
GenX Agent：实现跨模态自由创作，统一图文影音的理解、生成与编辑全流程。

百度文库在海外全新推出的一站式AI学习办公平台“Oreate”，短时间内已吸引百万级海外用户。

05.技术路线分化，AI竞争进入下半场

全球AI产业的技术路线正在明显分化：

百度选择“规模优先”的全能路线。通过文心5.0与GenFlow3.0构建全链路能力
OpenAI放弃刷榜专注“体验优先”的对话伙伴定位。
微博则开创“效率至上”的小模型路径。证明小模型的巨大价值

这种分化标志着大模型竞争进入下半场——从最初的技术参数竞赛，转向实用性与用户体验的较量。

技术路线的多元分化，正推动AI产业从技术驱动走向应用驱动，一个多层次、多场景的模型生态系统正在形成……

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。