新一轮大模型混战!百度亮出2.4万亿参数文心5.0,OpenAI却说:我们不跑分了!

『AI先锋杯·14天征文挑战第8期』 10w+人浏览 342人参与

丨技术奇点临近,全球大模型竞赛进入分水岭时刻。

如果一年前的大模型竞赛还是“百模大战”的混战状态,那么2025年末的这场竞争已逐渐分化出截然不同的技术路线与生态策略。

  • 就在11月13日,百度世界大会上,文心5.0以2.4万亿参数的庞大身躯亮相,宣称构建全球首个“原生全模态”模型。
  • 同一天,OpenAI却轻装简行,推出GPT-5.1系列,公然宣称“不跑分不刷榜”,专注“说人话”。
  • 微博旗下的VibeThinker-1.5B则以“小模型挑战巨无霸”的姿态,仅用15亿参数就在某些测试中击败了6710亿参数的DeepSeek R1。

这背后,是全球AI产业对技术路径的深刻分歧:是继续追求规模效应,还是转向实用主义?


01 百度文心5.0:原生全模态的野心

在11月13日的百度世界大会上,文心5.0以2.4万亿参数规模引发业内瞩目。参数规模远超上一代产品,采用超稀疏混合专家架构,有效提升推理效率。

文心5.0的核心定位是“原生全模态”,统一训练语言、图像、视频、音频。这与业界多数多模态模型采用后期融合的方式截然不同。

在实际测试中,文心5.0展现出了强大的多模态理解能力

丨例如,给它上传一个电影片段,它能精准分析出最紧张的情节,具体到第几秒到第几秒。同时上传一段视频和一段音频,它就能判断视频里是否使用了音频中的音乐,并准确说出使用节点。

在官方基准测试中,文心5.0 Preview在语言、视觉理解、音频理解、视觉生成多维度表现突出,其语言与多模态理解能力与Gemini-2.5-Pro、GPT-5-High等模型持平。

更早之前,文心5.0 Preview曾在LMArena大模型竞技场文本排行榜上得分1432,与GPT-4.5-preview、Claude-Opus-4-1等并列全球第二,位居国内第一。

02 OpenAI GPT-5.1:不刷榜只说人话与百度追求参数规模和技术全面性不同,OpenAI在同期发布的GPT-5.1系列选择了截然不同的路线

GPT-5.1包括两个子模型:

  • GPT-5.1 Instant面向日常对话和快速响应场景
  • GPT-5.1 Thinking用于复杂推理和深入问题场景

一句话概括,简单问题更快速,复杂问题更智能。

OpenAI官方特别强调,GPT-5.1“不跑分不刷榜,主打一个有人设,说人话,更情绪价值”。

GPT-5.1还增强了指令遵循能力。在明确告知只能用六个字回复的前提下,GPT-5.1 Instant能严守规矩,而GPT-5则常常已读乱回。

这一转变也引发了部分争议。有批评指出,OpenAI似乎将大量资源倾注于打磨对话的细腻度,而非拓展模型的认知边界。当用户试图引导其进行深度思辨或跨领域推理时,GPT-5.1往往退回安全区,给出中庸且泛化的回应。

03 微博VibeThinker-1.5B:小模型的逆袭

在各大厂商追逐参数规模的背景下,微博发布的VibeThinker-1.5B却走出了一条“小模型逆袭”的道路

https://github.com/WeiboAI/VibeThinker

https://huggingface.co/WeiboAI/VibeThinker-1.5B

这个仅有15亿参数的模型,

在多项复杂的数学和编程测试中击败了拥有6710亿参数的DeepSeek R1模型,而后者的体积是前者的400多倍。

训练这个小模型的总成本只有7800美元,而那些大模型的训练成本动辄数十万美元。VibeThinker的成功关键在于其创新的训练方法——“频谱到信号原理”训练框架。不追求模型的单次答题准确率,而是优化生成多个不同答案的能力,只要生成的多个答案中至少有一个正确就算成功。

VibeThinker的出现挑战了“大即是好”的简单粗暴思维,降低了AI研究和应用的门槛。

04 百度GenFlow3.0:全球最大通用智能体

除了文心5.0,百度还在百度世界大会上正式发布了GenFlow3.0,活跃用户超2000万,已成为“全球最大通用智能体”。

两大智能体:

  • Office Agent:是首个真正吃透办公套件的智能体,用户可用简单指令完成Excel复杂计算、Word深度排版等专业操作;
  • GenX Agent:实现跨模态自由创作,统一图文影音的理解、生成与编辑全流程。

百度文库在海外全新推出的一站式AI学习办公平台“Oreate”,短时间内已吸引百万级海外用户。

05.技术路线分化,AI竞争进入下半场

全球AI产业的技术路线正在明显分化

  • 百度选择“规模优先”的全能路线。通过文心5.0与GenFlow3.0构建全链路能力
  • OpenAI放弃刷榜专注“体验优先”的对话伙伴定位。
  • 微博则开创“效率至上”的小模型路径。证明小模型的巨大价值

这种分化标志着大模型竞争进入下半场——从最初的技术参数竞赛,转向实用性与用户体验的较量。

技术路线的多元分化,正推动AI产业从技术驱动走向应用驱动,一个多层次、多场景的模型生态系统正在形成……

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值