一键部署!OpenCloudOS 多项开源技术打造 “开箱即用” 的 AI 支撑底座

图片

12月6日,在以“以生态之力·让OS更懂未来”为主题的 2025 OpenCloudOS 操作系统生态大会上,OpenCloudOS 社区联动昇腾、海光、AMD、沐曦、昆仑芯、vLLM、SGLang、作业帮以及腾讯云,共同发布了 OpenCloudOS Infra 智能基座。这一重磅发布旨在系统性解决AI应用在异构算力环境下部署复杂、适配成本高等核心痛点,为开发者构建一个一体化、高性能、易部署的AI应用运行底座。

图片

当前,大模型与AI应用已从探索阶段迈入高速规模化部署新时期,爆发式增长的AI算力需求与极端碎片化、异构化的底层硬件环境形成尖锐矛盾。开发者或企业往往需要耗费大量精力在繁琐复杂的底层环境适配与部署上,这已成为制约企业在AI时代挖掘核心价值、创新产业发展的关键因素。

面对这一挑战,OpenCloudOS 社区确立了“重心在OS,延展至AI”的技术原则,以及“成为' AI时代最好用的OS'” 的目标,聚焦打磨OS内核、调度器、驱动兼容性、安全模块等传统优势领域,为AI工作负载提供独特的OS层价值,通过三大关键举措和多项技术创新,显著降低触及和利用异构算力的门槛,让开发者或企业能更专注于算法与模型的创新。

  三大核心举措,破解AI基础设施碎片化难题  

深度集成多样性算力支持:构建统一的多样性算力生态,是 OpenCloudOS 的核心优势。当前,OpenCloudOS 9及后续版本,已完成对 NVIDIA、AMD、昇腾、海光、沐曦、昆仑芯等国内外主流AI加速芯片厂商官方驱动及计算栈(SDK)的全面兼容和双向认证。用户无需再分别前往各芯片厂商官网搜寻、下载、编译和调试驱动程序,仅需在 OpenCloudOS 上通过标准 yum install 或 dnf install 命令,即可如同安装普通软件包一样,一键完成所有底层依赖的部署,极大简化了混合算力中心的运维管理。

开箱即用的主流AI框架容器镜像:OpenCloudOS 已通过容器化技术,完成了近20款主流AI框架及智能体(Agent)应用的深度适配、依赖解决和性能优化,并封装成可直接拉取使用的容器镜像。用户基于 OpenCloudOS 均可实现“一键部署,性能最优”。容器化不仅确保了AI应用运行环境的高度一致性和可移植性,保障了从开发到生产的全链路顺畅,还大幅提升了效率,将部署时间缩短至“分钟”级。

云上无缝集成:智能基座与腾讯云高性能应用服务(HAI)平台深度融合,并在HAI平台发布了预集成驱动的 OpenCloudOS 系统镜像。用户在选择 HAI 服务时,可直接选用该镜像,瞬间获得一个稳定、高性能、无需手动配置的 AI-ready 云服务器,极大简化了云上AI应用流程。

图片

  多项自研技术创新,打造高效、稳定、广兼容的AI应用运行底座  

FlexKV——大幅降低推理与延迟:FlexKV是面向超大规模 LLM 推理场景的分布式 KV Store 与多级缓存管理系统,这项技术通过将大模型推理过程中的 KVCache 逐层缓存至内存、SSD 及云端扩展存储(例如 GooseFS),有效解决了规模化推理的显存瓶颈。在实际应用中,FlexKV 展现出显著性能优势。在增强搜索场景下,TTFT(首Token延迟)在高并发下降低了70%;在智能问答助手场景中,对话时延降低了57%。

图片

OC Slimtrace——AI容器小型化镜像,降低镜像存储与传输开销:在AI开发中,容器镜像因需集成AI框架、依赖库与完整工具链,其体积常高达数十GB,带来巨大的存储、分发和启动开销。针对这一痛点,OC Slimtrace 通过软件包切片与动静态混合依赖分析两项关键技术,显著优化容器镜像体积,最大可缩减94%。助力用户实现镜像拉取速度加快、显著降低存储成本,并享受到更敏捷的容器启动体验,从而提升AI开发与部署的整体效率。

图片

OC Flip——容器镜像加速,加快集群启动与模型分发:在AI场景下,大规模集群冷启动时,常面临数十GB的镜像与模型文件需同时拉取的困境。受限于中心仓库带宽,往往导致集群冷启动时下载缓慢、耗时长,且镜像拉取时间占启动流程比重过高、本地读取效率不佳。为此,OC Flip(fast lazy image pull)基于优化增强的镜像懒加载技术,极大提升镜像分发加载效率,同时保持 OCIv1 镜像格式、兼容现网镜像存储驱动,实现了从“全部下载”到“即用即取”的转变。50G AI 镜像 sglang 场景冷启动(下载+服务运行)时间缩短60%。

图片

OC PkgAgent——智能软件包自动管理维护:为保障发行版的持续安全与稳定,OpenCloudOS 需要实时跟进上游社区海量的安全补丁与功能更新,为此推出的 PkgAgent 智能体系统,通过AI多智能体协同技术实现软件包管理的自动化革新,可将单个软件包处理时间从平均2.5小时缩短至分钟级,预计每年可节省超过 6000 小时的人力投入,并将漏洞修复的闭环效率提升了91.3%,显著增强了系统安全性与迭代敏捷性。

图片

OCAI——构建智能运维新范式:针对系统维护技术门槛高、场景复杂、问题诊断碎片化等问题,OpenCloudOS 打造了 OCAI 开放智能体驱动的智能运维新范式。通过 AI Agent 自动化完成系统维护工作流,打通了智能问答、智能诊断和智能调优的全链路,大幅提升系统运维效率。

图片

目前,OpenCloudOS 已完成与海光、龙芯、鲲鹏等主流CPU,以及沐曦、寒武纪、燧原等AI加速卡的全面适配,形成了完整的软硬件生态体系。社区采用 OC8.x 稳定版和 OC9.x 创新版双版并行发展策略,既保障企业级稳定性需求,又持续推动技术创新。同时,OpenCloudOS 已携手腾讯云、安谋科技、沐曦等生态合作伙伴,在AI算力底座、安全运维等领域打造了一系列经过大规模实践检验的解决方案。

腾讯云副总裁、腾讯蓬莱实验室负责人、OpenCloudOS 社区荣誉理事郭振宇在大会上表示,腾讯云将持续投入社区建设,构建安全的软件供应链体系,并开放更多场景资源深化AI生态,携手生态伙伴将 OpenCloudOS 打造为AI时代下安全、绿色、高性能、高可用的最佳基座。

OpenCloudOS 社区技术监督委员会(TOC)主席王佳强调,OpenCloudOS 的价值在于成为AI基础设施生态中的“最大公约数”,通过夯实 OS Infra 这一环,降低开发者触及和利用异构算力的门槛,让他们能更专注于算法与模型本身的创新。

AI技术从“工具”向“智能体”的演进,正在推动操作系统底层技术重构。OpenCloudOS Infra 智能基座的发布,标志着社区在拥抱AI趋势、以生态之力夯实基础软件底座方面迈出了关键一步,将为各行各业的数字化智能化转型提供更坚实支撑。


OpenCloudOS 开源社区是由操作系统、云平台、软硬件厂商与个人携手打造中立开放、安全稳定且高性能的 Linux 操作系统及生态。目前已实现从源社区、商业版、到社区稳定版全链路覆盖,旨在输出经海量业务验证的企业级稳定操作系统版本,为行业解决国产操作系统上下游供应问题,促进基础软件可持续发展。

图片

点击下方图片,了解加入社区权益与方式↓

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值