大模型第一股热闹正酣,“局外人”阶跃星辰发了一个小更新

henry 发自 凹非寺
量子位 | 公众号 QbitAI

“阶跃星辰怎么静悄悄…”

这就是年底国产大模型轮番冲刺热议一线时,阶跃星辰面临的外部评价。

Kimi靠K2重新获得证明,摆脱DeepSeek冲击波逆境;

DeepSeek靠OCR、金牌数学模型热传热议,让人更加期待后面的大招;

智谱和MiniMax一手新SOTA模型交卷,一手提起IPO进程……

而依然留在自研大模型牌桌上的“六小龙”选手阶跃星辰,甚至相比之前的“卷王”本王,都神秘安静得多。

直到刚刚,用最新的图像模型NextStep-1.1,扳回一球。

NextStep-1.1

总体来看,这次开源的NextStep-1.1解决了之前NextStep-1中出现的可视化失败(visualization failures )问题。

其通过扩展训练和基于流的强化学习(RL)后训练范式,大幅提升了图像质量。

相较之前发布的NextStep-1,NextStep-1.1的更新主要有两方面:

  • RL增强视觉保真度 : 通过RL显著改进了图像纹理,并大幅减少了视觉伪影(Visual Artifacts),确保输出更加清晰和专业。

  • 技术稳定性: 解决了自回归流匹配模型RL过程中固有的数值不稳定性(Numerical Instability)问题。

目前,NextStep-1.1已率先在GitHub和Hugging Face开源,但对应的技术报告尚未发布。

从已披露的信息来看,1.1版本的方法论基础仍然沿用NextStep-1论文中提出的自回归流匹配(autoregressive flow-matching)路线。

接下来,我们具体来看。

自回归流匹配的图像生成

NextStep-1系列架构的关键在于使用流匹配目标对连续图像Token进行直接、自回归建模

这种方法旨在取代传统的“AR+重型扩散模型”混合架构,NextStep-1通过逐Patch自回归生成,只用一个轻量级流匹配头,避开了对计算密集型DM的依赖。

具体来说,NextStep-1是一个拥有140亿参数(14B) 的自回归模型。

核心架构由Transformer骨干网络、用于处理离散文本 Token的标准语言建模头、用于处理连续图像Token的轻量级流匹配头,以及一个图像Tokenizer组成。

其中,NextStep-1采用因果Transformer来处理离散化后的文本与图像Token。

在训练阶段,Flow Matching Head基于输出的隐藏状态,预测从噪声样本到下一个目标图像patch的连续流(continuous flow)。

在推理阶段,该机制使模型能够通过迭代方式引导噪声,逐步生成下一个图像patch,从而完成整幅图像的生成。

在文生图任务中,NextStep-1展示出了接近传统扩散模型的生成质量,并且在图像编辑方面也表现优异。

然而,NextStep-1 在高维连续潜在空间下运行时,仍存在数值不稳定性,这可能导致输出图像出现块状或网格状的伪影。

最新的NextStep-1.1版本正是针对这一核心问题进行了优化与改进。

Kimi智谱Minimax轮番交卷

事实上,最新放出的NextStep-1.1只是阶跃最近密集更新节奏的一部分。

阶跃也当然没有“静悄悄”,自11月底至今,阶跃先后——

  • 开源GELab-Zero,主打安卓端本地部署与低门槛移动端智能体开发。

  • 开源8B推理模型——PaCoRe,在数学方面超越GPT-5。

  • 推出Step-GUI,包含云端模型、GUI Agent的MCP协议及开源端侧模型Step-GUI Edge,深化智能终端布局。

  • ……

但问题还是出在友商们太热闹了。

智谱和MiniMax不仅相继通过聆讯,冲刺IPO,还同步发布了自家最新的模型GLM-4.7和MiniMax M2.1。

Kimi也先后接入微软Azure,亚马逊Bedrock,其最新开源推理模型Kimi K2 Thinking也是广受好评。

当这些动作被放在同一时间轴上,实际上也体现着大模型竞争格局的变化。

在技术层面,Coding、Agent、多模态成为大模型主战场,开源生态成为主要策略。

而在资本层面,智谱和MiniMax的IPO也意味着大模型玩家在第一轮“百模大战”之后,胜者开始寻求更大的资本杠杆,开启更大战场的竞速。

大模型创业六小龙,实际已经名存实亡。

依然在坚持预训练、自研通用大模型路线的创业玩家,只剩下智谱、MiniMax、Kimi和阶跃星辰。

而他们接下来要竞速的玩家,都是巨头和小巨头。

但不论如何,创业明星们一步一登台,拿到了通往决赛圈入场券。

是否依然有能力自研基础大模型?是否粮草充足?是否可以构建商业模式飞轮实现造血可持续?

就是大模型玩家2026年竞速里无法回避的三大问题。

参考链接

https://x.com/StepFun_ai/status/2003746642026185055

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!

—  —

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值