追平GPT-4o,MATH-500数学基准拿到96.3%惊人高分,Hermes4 如何做到?

8月25日,AI圈炸出了一个重磅模型。

这事儿的主角,不是OpenAI,也不是谷歌,而是一家在圈外名不见经传,但在技术圈里却分量十足的研究机构——Nous Research。

他们悄无声息地,扔出新一代大模型,Hermes 4系列。

这一系列模型,不仅在数学、代码这些硬核指标上,交出了一份足以让许多顶级闭源模型汗颜的成绩单,更重要的是,它带来了一套全新的打法。用Nous Research自己的话说就是:“Hermes 4不仅是一组模型,更是一套全新的方法论——它证明,透明、可复现、开放的技术路径,完全可以与巨头们的封闭系统正面竞争,甚至在某些领域实现超越。”

这话说得相当有底气。那么,这个名不见经传的Nous,究竟是凭什么,敢叫板整个由千亿美金和海量GPU堆砌起来的AI帝国?别急,我们一层一层地把它扒开来看。

AI不仅要会思考,还得懂“闭嘴”

用过大模型的朋友可能都有过这种体验:你问它一个复杂问题,它要么“直来直去”给你一个简单答案,显得有点“笨”;要么就开始“滔滔不绝”,陷入一种无休止的“思考循环”,最后把自己给绕进去,直接爆了上下文窗口。

这就是行业里一个普遍的痛点。AI好像总是在“思考不足”和“思考过度”之间反复横跳。

Hermes 4给出的第一个答案,就叫“混合推理机制”。

听着挺玄乎,说白了就是让AI学会了“收放自如”。当用户需要它深度思考的时候,可以通过一个简单的指令,让模型进入“深度推理”模

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值