51CTO_AI PC 新纪元：NVIDIA DGX Spark vs AMD Ryzen AI Max+ 395 深度对比

最新推荐文章于 2025-12-05 11:17:30 发布

原创最新推荐文章于 2025-12-05 11:17:30 发布 · 1.3k 阅读

10 ·

CC 4.0 BY-SA版权

文章标签：

#人工智能 #spark #大数据 #DGX #AI工作站 #AMD #NVIDIA

AI 专栏收录该内容

56 篇文章

订阅专栏

AI PC 新纪元：NVIDIA DGX Spark vs AMD Ryzen AI Max+ 395 深度对比

AI PC 新纪元：NVIDIA DGX Spark vs AMD Ryzen AI Max+ 395 深度对比封面图.png

阅读原文

建议阅读原文，始终查看最新文档版本，获得最佳阅读体验：《AI PC 新纪元：NVIDIA DGX Spark vs AMD Ryzen AI Max+ 395 深度对比》

https://docs.dingtalk.com/i/nodes/X6GRezwJlAMg6vMGs6dPzgB58dqbropQ

AI PC 新纪元：NVIDIA DGX Spark vs AMD Ryzen AI Max+ 395 深度对比

引言

2025 年，人工智能技术正以前所未有的速度发展，AI PC 作为连接个人用户与强大 AI 能力的桥梁，正在成为科技行业的新焦点。今天，我们将深入对比两款引领 AI PC 革命的旗舰产品：NVIDIA DGX Spark和AMD Ryzen AI Max+ 395，看看它们如何重新定义个人 AI 计算的边界。

NVIDIA DGX Spark：桌面上的 AI 超级计算机

官方文档：您桌面上的 Grace Blackwell AI 超级计算机 | NVIDIA DGX Spark

核心架构与性能

NVIDIA DGX Spark 被誉为 “您桌面上的 Grace Blackwell AI 超级计算机”，它搭载了 NVIDIA 最新的GB10 Grace Blackwell 超级芯片，这一架构在 FP4 精度下能够提供高达1 petaFLOP 的 AI 性能。

关键规格：

处理器： NVIDIA Grace Blackwell 架构
内存： 128GB 统一寻址系统内存
网络： NVIDIA ConnectX 高性能网络
功耗： 仅 240W，能效比极高
尺寸： 紧凑型桌面设计

软件生态系统

DGX Spark 预装了完整的NVIDIA AI 软件堆栈，包括：

NVIDIA 工具和框架
优化的库和预训练模型
NVIDIA NIM 推理微服务
Docker 等开发环境

这种开箱即用的配置大大降低了 AI 模型在本地运行的门槛。

支持的主流开源大模型

DGX Spark 凭借其强大的硬件配置和优化的软件栈，能够流畅运行当前主流的开源大模型：

超大参数模型

GPT-OSS 120B： 预填充吞吐量约 2053 tokens/s，单 token 解码速度约 49.7 tokens/s
Llama 3.1 70B： FP8 量化版，预填充速度约 803 tokens/s，生成速度约 2.7 tokens/s
DeepSeek-R1： 推理速度快，性价比高
Qwen3 系列： 包括 Qwen3-30B、Qwen3-235B 等

中大型模型

Llama 3.1 8B： 预填充速度约 7991 tokens/s，每秒生成 20.5 tokens
Gemma 3 系列
DeepSpeed Coder 6.7B

技术亮点

双机互联能力： 通过 NVIDIA ConnectX 网络，可将两个 DGX Spark 系统连接，支持多达 4050 亿参数的 AI 模型
EAGLE3 推测解码： 启用后可使端到端推理吞吐量提升最高约 2 倍
兼容 OpenAI API： 提供标准的 REST API 接口，可像使用 ChatGPT 一样与本地模型交互
多模型并行运行： 支持同时运行多个大模型，如 GPT-OSS 120B + DeepSpeed Coder 6.7B + Qwen-3 embedding

AMD Ryzen AI Max+ 395：消费级 AI PC 的新标杆

官方文档：AMD 锐龙 AI Max+ 395

架构与性能表现

AMD Ryzen AI Max+ 395 代表了消费级 AI PC 的最高水平，它采用了先进的 “Strix Halo” 平台架构。

核心规格：

AI 引擎： 集成 50 TOPS 算力的 NPU 计算单元
总 AI 性能： 最高可达 126 TOPS
内存： 支持 128GB 统一内存，可分配 96GB 给 GPU
定位： 全球首款能运行 GPT-OSS-120b 模型的消费级 AI PC 处理器

软件优化与兼容性

AMD Ryzen AI Max+ 395 在软件层面进行了深度优化：

支持 GGML 框架转换的 MXFP4 格式
兼容 Hugging Face 和 Ollama 等热门平台
支持 MCP 模型上下文协议

支持的开源大模型

尽管定位消费级市场，AMD Ryzen AI Max+ 395 的 AI 性能令人印象深刻：

旗舰级模型

GPT-OSS 120B： 输出速率达 30-40 Token/s，仅需 61GB 显存
Qwen3-235B： 达到 14+Tokens/s 的推理速度
Llama4 Scout 109B： 流畅运行

主流模型

Qwen3-30B： 完美支持
各类 70B 参数模型： 轻松应对

技术创新

内存分配技术： 在 128GB 统一内存下可将 96GB 分配给 GPU，满足大模型需求
能效优化： 在提供强大 AI 性能的同时，保持了良好的能效比
消费级定位： 让普通用户也能体验到高端 AI 模型的强大能力

性能对比分析

硬件架构对比

特性	NVIDIA DGX Spark	AMD Ryzen AI Max+ 395
AI 性能	1 petaFLOP (FP4)	126 TOPS
NPU 算力	-	50 TOPS
内存	128GB 统一内存	128GB 统一内存
最大模型支持	4050 亿参数（双机）	2350 亿参数
功耗	240W	消费级功耗
定位	专业工作站	消费级 AI PC