蚂蚁开源万亿参数模型Ring-1T:奥数夺银打破行业壁垒,通用能力对标国际顶尖水平

2025年10月14日,蚂蚁集团向全球AI社区正式发布万亿参数级思考模型Ring-1T,并同步开放完整的模型权重文件与训练技术方案。这一里程碑式的开源举措,标志着中国科技企业在大模型核心技术领域实现从跟跑到领跑的跨越,为全球AI开发者提供了应对复杂推理难题的全新工具。

【免费下载链接】Ring-1T-preview 【免费下载链接】Ring-1T-preview 项目地址: https://ai.gitcode.com/hf_mirrors/inclusionAI/Ring-1T-preview

作为9月底发布的预览版(Ring-1T-preview)的升级版本,该模型通过创新的大规模可验证奖励强化学习(RLVR)技术路径,进一步释放万亿参数基座的深层推理潜能。开发团队透露,新版本特别强化了数学逻辑、几何证明等抽象思维能力,同时通过人类反馈强化学习(RLHF)技术优化通用任务处理能力,使模型在多维度评测中展现出更均衡的性能表现。开发者可通过官方渠道获取完整代码仓库:https://gitcode.com/hf_mirrors/inclusionAI/Ring-1T-preview

在国际数学奥林匹克(IMO2025)这一公认的智力竞技舞台上,Ring-1T创造了开源模型的历史最好成绩。在严格模拟竞赛环境的测试中,模型首次尝试即独立解出第1、3、4、5题,解题思路与标准答案高度吻合,达到IMO银牌选手的解题水平,成为全球首个在国际顶级数学赛事中获奖的开源AI系统。更值得关注的是,在第三次尝试中,模型针对难度极高的第2题几何证明题,输出了逻辑严密的推导过程,获得接近满分的评价;而在令多数顶尖模型折戟的第6题中,其计算结果"4048"虽与正确答案"2112"存在偏差,但已与谷歌Gemini 2.5 Pro的解题精度持平,展现出强大的复杂问题收敛能力。

通用能力评测数据同样令人瞩目。在权威的Arena-Hard V2人类偏好对齐测试中,Ring-1T以81.59%的胜率高居开源模型榜首,这一成绩已非常接近GPT-5-Thinking(High)的82.91%。医疗健康领域专业测评HealthBench显示,该模型在临床诊断推理、药物相互作用分析等专业任务中获得最高分,其输出的诊疗建议符合国际临床指南标准,为医疗AI的可信应用提供了新可能。

万亿参数模型的训练稳定性一直是行业公认的"达摩克利斯之剑"。蚂蚁百灵团队研发的"棒冰(icepop)"算法从根本上解决了这一痛点——通过带掩码的双向截断技术,将训练与推理阶段的分布差异控制在0.3%以内的安全阈值,确保2048token长序列训练过程中不会出现梯度爆炸或精度崩塌。配合自研的ASystem高性能强化学习系统(含开源框架AReaL),实现单机节点显存碎片99.7%的回收效率,权重参数交换零冗余损耗,使原本需要3000卡时的RL训练任务压缩至常规单机集群可承载的日常作业。

此次开源不仅提供模型文件,更公开了完整的"训练配方",包括1.2万亿tokens的多模态预训练数据构成、RLVR奖励函数设计方案以及分布式训练架构图。技术白皮书显示,该模型在4096张A100 GPU组成的集群上完成训练,总计算量达3.6e25 FLOPs,通过混合精度优化技术将能效比提升47%,为行业树立了绿色AI的新标杆。

回顾蚂蚁集团的大模型战略布局,此次发布形成清晰的产品矩阵:继10月9日推出通用大语言模型Ling-1T后,Ring-1T的问世标志着蚂蚁已构建起"通用能力+专业思考"的双引擎体系。加上此前发布的18款不同参数规模模型,其产品线已实现从160亿到1万亿参数的全覆盖,可满足从边缘计算到超算中心的多层次应用需求。

业内专家分析指出,Ring-1T的突破性进展体现在三个维度:首次将强化学习与数学形式化验证相结合,开创"可解释推理"新范式;通过全链路开源打破大模型技术垄断,推动AI伦理治理透明化;多智能体框架AWorld的引入,为复杂系统问题提供了分布式解决方案。这些创新不仅提升模型性能,更重构了大模型研发的方法论体系。

目前,开发者可通过HuggingFace、魔搭社区等平台下载模型,或通过蚂蚁百宝箱在线体验系统进行API调用测试。随着这一开源生态的持续完善,预计将催生教育、科研、工程等领域的创新应用,特别是在数学教育个性化辅导、工程问题自动推演等场景展现巨大潜力。蚂蚁集团表示,将持续投入模型迭代优化,计划在2026年第一季度发布支持多语言跨模态推理的Ring-2T版本,进一步拓展AI技术的应用边界。

【免费下载链接】Ring-1T-preview 【免费下载链接】Ring-1T-preview 项目地址: https://ai.gitcode.com/hf_mirrors/inclusionAI/Ring-1T-preview

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值