阶跃星辰开源Step 3大模型:重构多模态推理范式,推理成本下降60%
【免费下载链接】step3-fp8 项目地址: https://ai.gitcode.com/hf_mirrors/stepfun-ai/step3-fp8
2025年7月31日,人工智能企业阶跃星辰正式对外发布新一代基础大模型Step 3,并宣布该模型全面开源。开发者可通过阶跃星辰开放平台(platform.stepfun.com)调用API接口,或通过"阶跃AI"官网(stepfun.com)及移动端应用体验模型能力。此次发布标志着国内开源大模型在多模态融合与推理效率优化领域实现重大突破。
均衡设计:321B参数背后的效率革命
Step 3采用混合专家(MoE)架构设计,总参数量达3210亿,但通过动态路由机制使实际激活参数量控制在380亿,在保持复杂任务处理能力的同时显著降低计算资源消耗。官方测试数据显示,该模型在MMMU多模态理解评测中取得68.3%的准确率,MathVision数学视觉推理任务正确率达57.2%,在同类开源模型中处于领先水平。
特别值得关注的是其创新的MFA(Multi-matrix Factorization Attention)注意力机制,通过矩阵分解技术将传统注意力计算中的KV缓存占用降低40%。配合AFD(Attention-FFN Disaggregation)解码流程重构,模型在Hopper架构GPU上实现4039 token/秒/卡的推理吞吐量,较行业同类产品提升73.8%,长文本处理场景下性能优势更可达3倍以上。
视觉突破:轻量化路径优化多模态困境
针对多模态模型普遍面临的视觉Token膨胀问题,Step 3创新采用50亿参数视觉编码器,通过双层2D卷积降采样技术,将图像特征Token数量压缩至传统方案的1/16。这一突破使模型能在常规上下文窗口内处理更高分辨率图像,SimpleVQA视觉问答任务准确率提升至89.7%,同时推理延迟降低52%。
训练过程采用两阶段协同策略:第一阶段专注视觉编码器的感知能力强化,第二阶段冻结视觉模块仅优化语言主干与跨模态连接层,有效避免模态干扰。配合经过相似度过滤的2.3万亿tokens多模态语料,模型实现数学公式识别、图表分析等复杂视觉任务的端到端处理,AIME 2025数学竞赛题解题正确率达31.4%。
部署革新:StepMesh库实现跨硬件标准化
为解决模型性能在实际部署中的衰减问题,阶跃星辰同步开源专为AFD架构设计的StepMesh通信库。该库基于GPU Direct RDMA技术构建,支持跨硬件平台的低延迟数据传输,在8卡集群环境中实现92%的硬件资源利用率。实测显示,采用StepMesh部署的Step 3模型,在保持50ms响应延迟的同时,服务稳定性达到99.9%。
开发者生态方面,模型提供统一的部署接口规范,已完成对NVIDIA、AMD、华为昇腾等主流硬件平台的适配。官方同时推出限时优惠政策,即日起至2025年9月30日,API调用按最低阶梯计费,输入token单价1.5元/百万,输出token4元/百万,较行业平均价格降低60%以上。
开源生态:引爆AI工业化应用
Step 3的开源将加速多模态AI技术的工业化落地进程。在代码生成领域,其在LiveCodeBench评测集(2024.08-2025.05区间)中获得48.2%的通过率;知识密集型任务方面,GPQA-Diamond数据集测试正确率达62.5%,展现出在企业级知识库构建、智能客服等场景的应用潜力。
阶跃星辰创始人兼CEO张宇透露,团队已启动Step 3的行业适配计划,首批将重点覆盖智能制造质检、医疗影像分析、金融文档理解等垂直领域。随着模型开源生态的完善,预计将带动超过10万开发者参与二次创新,推动AI应用开发成本进一步降低。
目前,Step 3模型权重、训练代码及部署工具已通过GitCode平台开放下载(仓库地址:https://gitcode.com/hf_mirrors/stepfun-ai/step3-fp8),开发者可免费用于商业及非商业用途。这一举措有望加速国内大模型技术的标准化与产业化进程,为AI行业发展注入新动能。
【免费下载链接】step3-fp8 项目地址: https://ai.gitcode.com/hf_mirrors/stepfun-ai/step3-fp8
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考



