ServiceNow-AI 发布 Apriel-1.5-15b-Thinker:150亿参数多模态模型凭“中间训练“策略挑战行业巨头

ServiceNow-AI 发布 Apriel-1.5-15b-Thinker:150亿参数多模态模型凭"中间训练"策略挑战行业巨头

【免费下载链接】Apriel-1.5-15b-Thinker 【免费下载链接】Apriel-1.5-15b-Thinker 项目地址: https://ai.gitcode.com/hf_mirrors/ServiceNow-AI/Apriel-1.5-15b-Thinker

ServiceNow-AI 团队近日推出的 Apriel-1.5-15b-Thinker 多模态推理模型,为人工智能训练领域带来了突破性的新思路。该模型以"中间训练即所需"(Mid training is all you need)为核心理念,通过深度且广泛的持续预训练(Continual Pre-training, CPT)在文本与图像领域构建了扎实的基础能力。尤为值得关注的是,即便未进行图像特定的指令微调(SFT)和强化学习(RL),该模型仍在多模态推理任务中展现出领先性能,这一成果彻底打破了行业的传统认知,揭示出智能的中间训练策略可能比后期复杂的专门优化更为关键。

在性能表现方面,这款仅含 150 亿参数的模型,在 Artificial Analysis 指数中斩获 52 分的优异成绩,与 Deepseek R1 0528、Gemini-Flash 等参数量远超其十倍的大型模型不相上下。

柱状图展示Artificial Analysis Intelligence Index下多个AI模型的得分,其中Apriel-1.5-15b-Thinker模型以52分(红色框标注)的成绩呈现其多模态推理性能。 如上图所示,柱状图清晰对比了多个AI模型在Artificial Analysis Intelligence Index下的得分情况,Apriel-1.5-15b-Thinker以红色框标注的52分成绩格外突出。这一性能数据充分体现了该模型在多模态推理领域的强大实力,为关注AI模型性能的研究者和企业用户提供了直观的参考依据。

在关键的企业级基准测试中,Apriel-1.5-15b-Thinker 同样表现抢眼,在 Tau2 Bench Telecom 测试中达到 68 分,在 IFBench 测试中获得 62 分,有力地证明了其在实际应用场景中的卓越能力。该模型的一大显著优势在于其高效性,150 亿的参数规模使其能够轻松部署在单张 GPU 上,极大地降低了计算资源需求和推理成本。

研发理念与技术细节上,ServiceNow-AI 团队秉持在有限资源下追求卓越的原则,着重强调通过精心的数据设计与稳健的方法论来构建顶尖模型,其核心策略是优先实现 SOTA(State-of-the-Art)级别的性能。该模型默认执行广泛推理,并投入额外的内部努力来提升稳健性与准确性,即便面对更简单的查询也不例外。虽然初期版本可能存在 token 使用量较高和响应时间略长的问题,但团队已明确表示正致力于未来版本的效率优化。

模型的训练过程分为持续预训练(CPT)和监督微调(SFT)两个关键阶段。在 CPT 阶段,模型学习了数亿个来自数学推理、编程挑战、科学论述、逻辑谜题以及各类丰富知识文本的样本,同时还涵盖了图像理解、推理、图像描述以及图文交错数据等内容,此阶段的核心目标是强化模型的通用推理能力。而在 SFT 阶段,模型在超过 200 万个高质量文本样本上进行了微调,这些样本涵盖数学科学问题解决、编程任务、指令遵循、API 调用以及对话场景等多个领域。值得一提的是,尽管未针对图像进行特定微调,但模型凭借其固有的多模态能力以及文本 SFT 带来的跨模态推理行为转移,在图像任务上依然取得了出色表现。

对于希望快速体验该模型的用户,Apriel-1.5-15b-Thinker 已在 Hugging Face 平台开放,用户可通过 Python 的 transformers 库便捷地加载和使用。模型页面提供了详细的运行指令与代码示例,方便用户快速上手。对于追求更高性能的用户,在部署时可考虑结合 vLLM,并利用其定制的工具与推理解析器进行进一步优化。未来,随着模型效率的不断提升,Apriel-1.5-15b-Thinker 有望在更多企业级应用场景中发挥重要作用,推动 AI 技术在实际业务中的普及与应用。

【免费下载链接】Apriel-1.5-15b-Thinker 【免费下载链接】Apriel-1.5-15b-Thinker 项目地址: https://ai.gitcode.com/hf_mirrors/ServiceNow-AI/Apriel-1.5-15b-Thinker

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值