单机8卡GPU，私密云计算平台升级！

NVIDIA AI 技术专区

于 2025-04-16 15:34:55 发布

阅读量379

点赞数 5

CC 4.0 BY-SA版权

文章标签：云计算

本文链接：https://blog.youkuaiyun.com/NVIDIA_Community/article/details/147278277

大规模推理模型的安全一直都是企业最关注的核心要素之一。继3月发布大模型应用防火墙后，今天，火山引擎再次与 NVIDIA 合作，对火山引擎端到端 AI 安全产品 PCC（Private Cloud Compute）私密云计算平台进行重磅升级。

升级后，火山引擎 PCC 私密云计算平台将支持 NVIDIA 机密计算，并提供远程证明功能，用户能在单机8卡 GPU 上运行如 DeepSeek-R1等大尺寸模型推理时，为数据安全和隐私保护提供更全面的保障。

火山引擎 PCC 私密云计算平台，旨在为企业客户提供高度安全、隐私保护的云端计算服务，将企业设备端的安全和隐私标准“搬上云”，确保用户数据在处理过程唯用户所见，唯用户所用，并在任务完成后永久删除数据。

机密计算+远程证明

保护大模型数据安全

企业对在云端运行大语言模型和其他推理模型表示担忧，并希望确保模型在使用期间，数据不被窃取和误用。火山引擎 PCC 私密云计算平台以可信执行环境为用户创建了“安全屋”，适用于采用 NVIDIA 机密计算的 GPU 上运行的模型。通过内置的硬件隐私保护机制，用户输入的 Prompt 通过完全加密的环境传入“安全屋”，推理时延比明文模式差异仅在5%以内。

如今模型的尺寸越来越大，如满血版的 DeepSeek-R1模型尺寸高达671B。火山引擎与 NVIDIA 紧密合作，将单卡 GPU 扩展到8卡 GPU，大幅度提高了计算性能和所支持模型的尺寸上限。

不过从单卡 GPU 扩展到8卡 GPU 也并非易事，这需要将这些独立的“安全屋”纳入一个更大的“域”当中，在“屋与屋”之间构建安全通信通道，以保证数据传递的速率。

针对这一难点，火山引擎又引入了 NVIDIA NVLink 和 NVSwitch 技术，可以在一台机器上实现多张 GPU 高效通信，为了将该技术运用在火山引擎 PCC 私密云计算平台，NVIDIA 推出了 PPCIE 安全模式，将8卡 GPU 纳入同一“可信域”，实现多卡高效通信。

在此基础上，火山引擎在底层构建了异构远程证明协议，不仅能验证“可信域”中的模型和服务完整性，还提供模型加密和机密数据传输等功能，实现从 CPU 到8卡 GPU 的完整远程验证功能。

毫秒级响应，损耗低于5%

为AI技术规模化应用保驾护航

经过双方共同努力，支持单机8卡的火山引擎 PCC 私密云计算平台，可实现对满血 DeepSeek 规格模型的全面支持，不仅能确保数据的安全性和隐私性，完整的远程证明功能，可实现毫秒级响应，据测试，AI 应用场景下，推理时延相比明文的损耗不超5%。

此外，火山引擎 PCC 还支持安全可信的云原生机密容器系统、可信密钥管控和安全数据流转、丰富的安全 AI 应用生态支持、多场景的部署方式等优势特性，能够支持更多种类的复杂模型和大规模高并发业务：

手机快速记录：对于端侧用户来说，手机和电脑是极其私密的个人终端，快速记录功能需要确保用户输入的语音、视频的隐私安全，火山引擎 PCC 私密云计算平台，可在大模型推理过程中，全程以密文形式处理用户数据，保障用户隐私安全。

电脑文档处理：电脑端包含了大量的企业和私人隐私数据，以会议纪要场景为例，处理时会自动提取分析和概括会议内容，火山引擎 PCC 私密云计算平台，通过全程密文的方式高效总结、概括会议内容。

智能车载助手：智能车载助手的数据可能包含车辆位置、行驶轨迹、语音指令等敏感信息，火山引擎 PCC 私密云计算平台，可在快速响应车主需求的同时，全面保障隐私数据安全，让高效与安全无缝结合。

代码智能审核：代码智能审核能够高效检测和分析代码中的安全漏洞、性能以及合规风险，但代码也是企业的核心的数据资产，火山引擎 PCC 私密云计算平台，支持大模型密文处理代码，并通过优异性能提升审核分析速率。

未来，火山引擎还将继续为大模型的安全开辟一个可信的空间，进一步推动 AI 技术在安全环境中的规模化应用，释放 AI 潜力。