蚂蚁集团开源万亿参数模型Ling-1T:刷新开源模型推理性能新高度
【免费下载链接】Ling-1T 项目地址: https://ai.gitcode.com/hf_mirrors/inclusionAI/Ling-1T
10月9日,蚂蚁集团正式发布并开源通用语言模型Ling-1T,作为其百灵大模型Ling 2.0系列的首款旗舰级非思考模型,该模型凭借在复杂推理任务中的卓越表现引发行业广泛关注。尤其在代码生成与竞赛数学等核心领域,Ling-1T已跃居当前开源模型性能榜首,标志着国内大模型技术在高效推理方向取得重要突破。
在国际权威竞赛数学评测AIME 25榜单中,Ling-1T展现出惊人的推理精度与效率平衡能力。测试数据显示,该模型平均仅需消耗4000+Token即可达到70.42%的准确率,这一成绩不仅超越了同量级开源模型,甚至优于Google Gemini-2.5-Pro(5000+Token,70.10%准确率)的表现。这种"以更少资源实现更高精度"的特性,使其在实际应用中具备显著的成本优势和部署灵活性。
如上图所示,2025世界人工智能大会蚂蚁展台展示了基于大模型技术的"健康问AQ 有问必答"等服务场景。这一应用案例充分体现了Ling-1T模型在实际场景中的落地能力,为开发者和企业用户提供了直观的技术应用参考。
技术架构层面,Ling-1T深度融合了蚂蚁集团自研的Ling 2.0架构创新,通过20T+高推理浓度语料的预训练过程,构建起强大的知识储备与逻辑推理基础。模型支持128K超长上下文窗口,能够处理更长文本的复杂任务,而独创的"中训练+后训练"Evo-CoT技术体系,则进一步强化了其多步推理能力。值得关注的是,研发团队采用创新的FP8混合精度训练方案,实现了15%以上的端到端训练加速,同时通过LPO句子级策略优化算法,有效保障了超大规模模型训练过程的稳定性。
如上图所示,AIME-25任务对比图表清晰呈现了Ling-1T与其他主流模型在准确率和Token消耗上的性能差异。这一可视化对比充分体现了Ling-1T在推理效率与精度平衡上的技术优势,为算法工程师选择模型提供了关键决策依据。
除数学推理外,Ling-1T在专业领域的能力同样亮眼。在ArtifactsBench前端开发能力基准测试中,模型以59.31分的成绩位居开源模型首位,证明其在特定专业领域已具备接近行业专家的问题解决能力。蚂蚁集团同时透露,团队正在并行研发万亿参数级深度思考模型Ring-1T,目前该模型的preview版本已同步开源,形成"非思考+深度思考"的模型矩阵布局。
此次Ling-1T的开源不仅为学术界提供了高质量的研究基座,更为企业级应用开发降低了技术门槛。开发者可通过Gitcode仓库获取完整模型资源,快速部署适用于金融、教育、医疗等多场景的智能应用。随着大模型技术从参数竞赛转向效率优化,Ling-1T展现的"精准推理+高效计算"范式,或将成为下一代通用人工智能的重要发展方向。未来,随着Ring系列模型的持续迭代,蚂蚁百灵大模型有望构建起更完整的智能服务生态,推动AI技术在产业数字化转型中发挥更大价值。
【免费下载链接】Ling-1T 项目地址: https://ai.gitcode.com/hf_mirrors/inclusionAI/Ling-1T
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考



