2025年7月18日至19日,2025中国联通合作伙伴大会在上海世博中心盛大举行。这场聚焦“网络筑基、科技赋能、产业革新、消费升级、安全护航”五大领域的行业盛会,汇聚了众多产业链伙伴,共同探索数字技术融合创新的前沿路径。
九州未来作为中国联通长期紧密的产业链合作伙伴,受邀参展生态合作伙伴展区,重点展示了自主研发的AI-Studio大模型推训平台,展现了其在“边缘计算+AI”双轮驱动下,助力新质生产力发展的创新实践与前沿成果。
AI-Studio:推训一体的敏捷AI协作平台
本次展出的核心产品——AI-Studio,定位为一款从开发训练到推理计费的敏捷AI协作平台,致力于为客户提供统一、高效、标准的AI开发流程支持,以及可扩展的人工智能基础设施管理能力。平台支持多租户模式,核心功能覆盖:
- AI工作流编排与在线开发:集成Jupyter Notebook交互式开发工具,支持多种开发语言和插件,用户可在线编辑模型并保存至模型库。
- 可视化建模与模型微调:提供拖拉拽式任务流画布,支持用户自由组合数十种算子与框架进行模型建构。支持用户从模型库选择与训练模型,上传或选择特定任务数据进行预处理,配置参数后一键微调,提升模型精确度和适用性。
- 数据与资源管理:支持数据集全生命周期管理(创建、下载、版本迭代)。具备GPU/NPU切分隔离与虚拟化能力,支持基于算力和内存限制的GPU切分(不依赖特定硬件),并能对多集群、多资源组、异构GPU环境进行统一纳管、监控和智能调度,模型服务可跨集群部署。
- 模型部署与高性能推理服务:支持用户将模型(通过模型文件+计算框架或模型镜像两种方式)一键部署为在线推理服务。支持手动/自动扩展服务实例,并提供统一的在线推理服务管理界面(启停、灰度更新、监控等)。平台通过全链路FP8量化、KV Cache稀疏压缩算法、KV Cache在节点池内共享、投机采样等技术,显著提升推理性能,打破显存、算力和带宽限制。
- 知识库与RAG应用:提供知识库系统,支持用户上传文档进行切片处理与存储管理。支持创建RAG(检索增强生成)应用,通过检索知识库信息结合大语言模型生成更准确、贴合上下文的回答,适用于智能客服、内容创作等场景。
深化合作,共筑开放技术生态
九州未来与中国联通的合作源远流长。自2018年成为中国联通边缘生态合作伙伴并获颁“边缘计算金牌合作伙伴先行者”称号以来,双方在边缘计算、AI融合应用等领域持续深化合作,共同推动技术创新与落地。
此次大会上AI-Studio的展示,不仅体现了九州未来在AI基础设施领域的技术积累,更凸显了双方在“AI+边缘计算”融合应用场景上的巨大协同潜力。未来,九州未来将持续秉持开放创新的理念,与中国联通及广大产业链伙伴紧密协作。通过AI-Studio等平台,持续推动AI技术在千行百业的规模化、高效化落地,助力企业便捷开发、部署和管理AI应用。共同构建开放共赢的技术生态,为数字经济高质量发展注入强劲动能。