大规模推理模型的安全一直都是企业最关注的核心要素之一。继3月发布大模型应用防火墙后,今天,火山引擎再次与 NVIDIA 合作,对火山引擎端到端 AI 安全产品 PCC(Private Cloud Compute)私密云计算平台进行重磅升级。
升级后,火山引擎 PCC 私密云计算平台将支持 NVIDIA 机密计算,并提供远程证明功能,用户能在单机8卡 GPU 上运行如 DeepSeek-R1等大尺寸模型推理时,为数据安全和隐私保护提供更全面的保障。
火山引擎 PCC 私密云计算平台,旨在为企业客户提供高度安全、隐私保护的云端计算服务,将企业设备端的安全和隐私标准“搬上云”,确保用户数据在处理过程唯用户所见,唯用户所用,并在任务完成后永久删除数据。
机密计算+远程证明
保护大模型数据安全
企业对在云端运行大语言模型和其他推理模型表示担忧,并希望确保模型在使用期间,数据不被窃取和误用。火山引擎 PCC 私密云计算平台以可信执行环境为用户创建了“安全屋”,适用于采用 NVIDIA 机密计算的 GPU 上运行的模型。通过内置的硬件隐私保护机制,用户输入的 Prompt 通过完全加密的环境传入“安全屋”,推理时延比明文模式差异仅在5%以内。
如今模型的尺寸越来越大,如满血版的 DeepSeek-R1模型尺寸高达671B。火山引擎与 NVIDIA 紧密合作,将单卡 GPU 扩展到8卡 GPU,大幅度提高了计算性能和所支持模型的尺寸上限。
不过从单卡 GPU 扩展到8卡 GPU 也并非易事,这需要将这些独立的“安全屋”纳入一个更大的“域”当中,在“屋与屋”之间构建安全通信通道,以保证数据传递的速率。
针对这一难点,火山引擎又引入了 NVIDIA NVLink 和 NVSwitch 技术,可以在一台机器上实现多张 GPU 高效通信,为了将该技术运用在火山引擎 PCC 私密云计算平台,NVIDIA 推出了 PPCIE 安全模式,将8卡 GPU 纳入同一“可信域”,实现多卡高效通信。
在此基础上,火山引擎在底层构建了异构远程证明协议,不仅能验证“可信域”中的模型和服务完整性,还提供模型加密和机密数据传输等功能,实现从 CPU 到8卡 GPU 的完整远程验证功能。
毫秒级响应,损耗低于5%
为AI技术规模化应用保驾护航
经过双方共同努力,支持单机8卡的火山引擎 PCC 私密云计算平台,可实现对满血 DeepSeek 规格模型的全面支持,不仅能确保数据的安全性和隐私性,完整的远程证明功能,可实现毫秒级响应,据测试,AI 应用场景下,推理时延相比明文的损耗不超5%。
此外,火山引擎 PCC 还支持安全可信的云原生机密容器系统、可信密钥管控和安全数据流转、丰富的安全 AI 应用生态支持、多场景的部署方式等优势特性,能够支持更多种类的复杂模型和大规模高并发业务:
手机快速记录:对于端侧用户来说,手机和电脑是极其私密的个人终端,快速记录功能需要确保用户输入的语音、视频的隐私安全,火山引擎 PCC 私密云计算平台,可在大模型推理过程中,全程以密文形式处理用户数据,保障用户隐私安全。
电脑文档处理:电脑端包含了大量的企业和私人隐私数据,以会议纪要场景为例,处理时会自动提取分析和概括会议内容,火山引擎 PCC 私密云计算平台,通过全程密文的方式高效总结、概括会议内容。
智能车载助手:智能车载助手的数据可能包含车辆位置、行驶轨迹、语音指令等敏感信息,火山引擎 PCC 私密云计算平台,可在快速响应车主需求的同时,全面保障隐私数据安全,让高效与安全无缝结合。
代码智能审核:代码智能审核能够高效检测和分析代码中的安全漏洞、性能以及合规风险,但代码也是企业的核心的数据资产,火山引擎 PCC 私密云计算平台,支持大模型密文处理代码,并通过优异性能提升审核分析速率。
未来,火山引擎还将继续为大模型的安全开辟一个可信的空间,进一步推动 AI 技术在安全环境中的规模化应用,释放 AI 潜力。