今日,人工智能领域迎来重要突破——国内自主研发的万亿参数思考模型Ring-1T正式对外发布。作为首个实现开源的万亿级MoE架构认知模型,开发者可通过Hugging Face、ModelScope等平台获取完整权重文件,或直接通过Ling Chat交互界面及ZenMux开发平台体验其强大功能(完整访问方式见文末说明)。这一里程碑式的发布,标志着我国在大模型深层推理领域实现了从跟跑到领跑的技术跨越。
【免费下载链接】Ring-1T 项目地址: https://ai.gitcode.com/hf_mirrors/inclusionAI/Ring-1T
基于上月发布的技术预览版,研发团队通过大规模可验证奖励强化学习(RLVR)持续优化模型性能,进一步释放万亿参数基座模型的自然语言推理潜能。经过多轮人类反馈强化学习(RLHF)精细调校,当前版本的Ring-1T在保持核心能力领先的同时,实现了跨任务性能的全面均衡,尤其在数学推理、代码生成等复杂认知任务上展现出突破性进展。
该模型采用全新Ling 2.0架构,基于1万亿总参数、500亿激活参数的Ling-1T-base基座模型构建,支持长达128K tokens的上下文窗口。通过自研icepop强化学习稳定技术与高效强化学习系统ASystem(其AReaL框架已开源),研发团队成功实现MoE架构强化学习的平滑扩展——从百亿级(Ring-mini-2.0)到千亿级(Ring-flash-2.0)再到万亿级(Ring-1T)参数规模的技术突破,使模型深层推理与自然语言推断能力得到数量级提升。
如上图所示,Ring-1T的Logo设计融合了无限符号与神经元网络意象,象征模型通过万亿参数间的协同交互实现认知能力的突破。这一视觉符号既代表技术架构的创新,也隐喻人工智能从数据拟合向自主思考进化的行业趋势。
全场景推理能力的跨越式提升
为全面评估Ring-1T的认知推理水平,研发团队选取当前主流开源思考模型(Ring-1T-preview、Deepseek-V3.1-Terminus-Thinking、Qwen-235B-A22B-Thinking-2507)及闭源API服务(Gemini-2.5-Pro、GPT-5-Thinking(High))作为对照基准。测试结果显示,相较于此前开源的预览版本,Ring-1T不仅在各项任务指标上实现全面提升,更在数学竞赛(AIME 25、HMMT 25)、代码生成(LiveCodeBench、CodeForce)、逻辑推理(ARC-AGI-1)等挑战性基准测试中刷新开源模型性能纪录,同时在综合能力评测(Arena-Hard-v2.0)、医疗健康(HealthBench)、创意写作(Creative Writing v3)等领域展现出与闭源商业模型的竞争实力。
该图表直观呈现了Ring-1T与当前主流模型在六大核心能力维度的对比结果。从数据分布可见,Ring-1T在数学推理与代码生成领域已超越开源同类模型15%-20%,尤其在需要多步逻辑链的复杂任务中优势更为显著,为开发者提供了高性能且可定制的技术基座。
Icepop技术:解决MoE模型强化学习稳定性难题
在MoE(混合专家)模型的强化学习训练中,由于训练与推理引擎的算子实现差异远大于稠密模型,随着序列长度增加和训练步数累积,这种技术偏差会持续放大,在长文本生成和大规模训练周期中表现得尤为突出。实验数据显示,传统GRPO算法在经过相对较少的训练步数后即出现性能崩溃,而研发团队提出的Icepop算法通过掩码双向截断技术修正分布偏差,有效缩小训练与推理阶段的性能差距,形象地"冷却"了快速攀升的训练推理差异。
图表清晰展示了两种算法在训练过程中的性能稳定性对比。纵轴代表训练-推理差异度,曲线显示GRPO算法在500步后差异度呈指数级增长,而Icepop算法通过动态分布校正机制,将差异度始终控制在0.15以内,为万亿参数模型的稳定训练提供了关键技术保障。
ASystem系统:自主研发的强化学习"超级引擎"
为支撑万亿参数基座模型的稳定高效强化学习训练,研发团队独立构建了高性能强化学习系统ASystem。该系统采用SingleController + SPMD分布式架构,在训练推理引擎层面针对万亿级模型特有的内存管理和权重交换难题进行深度优化。通过自研的训练推理统一内存池技术,实现内存透明卸载与碎片高效回收,显著降低内存溢出风险;借助GPU间直接P2P通信与原地更新等创新技术,将模型权重交换延迟压缩至秒级,且实现零冗余数据传输。
该柱状图对比了两种算法在完整训练周期内的最大差异值。数据显示Icepop算法将最大差异度从GRPO的0.82降至0.18,降幅达78%。这种稳定性提升使模型能够完成10倍于传统方法的训练步数,为深层认知能力的培养提供了充足的训练"里程"。
Ring-1T的开源发布不仅提供了先进的技术工具,更通过开放核心算法与训练框架,推动整个行业在大模型训练方法上的共同进步。随着认知智能技术的不断演进,我们有理由相信,以Ring-1T为代表的新一代思考模型将在科研探索、医疗诊断、代码开发等关键领域发挥越来越重要的作用。开发者可通过访问https://gitcode.com/hf_mirrors/inclusionAI/Ring-1T获取完整技术文档与模型资源,共同参与人工智能认知革命的技术实践。
【免费下载链接】Ring-1T 项目地址: https://ai.gitcode.com/hf_mirrors/inclusionAI/Ring-1T
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考



