NVIDIA JetPack 6.2 为 NVIDIA Jetson Orin Nano 和 Jetson Orin NX 模块带来了超级模式

介绍 NVIDIA Jetson Orin Nano 超级开发工具包 的上市为小型边缘设备的 生成式人工智能 开启了一个新时代。新的 超级模式 给予了开发工具包高达 1.7 倍的前所未有的生成式人工智能性能提升,使其成为最具性价比的生成式人工智能超级计算机。

JetPack 6.2 现已推出,以支持Jetson Orin NanoJetson Orin NX生产模块的超级模式,提供高达 2 倍的生成 AI 模型性能。现在您可以为新的和现有的机器人及边缘 AI 应用程序释放更大的价值,并降低总体拥有成本。

本文讨论了超级模式的细节,包括新的功率模式、针对 Jetson Orin Nano 和 Orin NX 模块的流行生成 AI 模型的基准测试、文档更新以及支持超级模式的 NPN 合作伙伴的见解。

Jetson Orin Nano 和 Jetson Orin NX 系列的新参考电源模式

JetPack 6.2 通过解锁 GPU、DLA 内存和 CPU 时钟的更高频率,为 Jetson Orin Nano 和 Jetson Orin NX 系列提供了性能提升。

MODULE现有参考电源模式
(可用与现有的闪烁配置)
新电源模式
(仅在新的闪烁配置下可用)
NVIDIA Jetson Orin Nano 4GB7W, 10W10W, 25W,MAXN超级
NVIDIA Jetson Orin Nano 8GB7W, 15W15W, 25W,MAXN超级
NVIDIA Jetson Orin NX 8GB10W, 15W, 20W, MAXN10W, 15W, 20W, 40W,MAXN SUPER 
NVIDIA Jetson Orin NX 16GB10W, 15W, 25W, MAXN10W, 15W, 25W, 40W,MAXN超级

表 1. Jetson Orin Nano 和 Jetson Orin NX 模块的新参考功率模式

Jetson Orin Nano 模块现在有一个 25W 模式和一个新的无上限 MAXN SUPER 模式。同样,Jetson Orin NX 模块现在可以使用一个新的更高的 40W 参考功率模式以及一个无上限 MAXN SUPER 模式。

MAXN SUPER 是一种不受限制的电源模式,允许 CPU、GPU、DLA、PVA 和 SOC 引擎使用最高数量的核心和时钟频率。如果在此模式下模块的总功率超过了热设计功率(TDP)预算,则模块将被限制到较低的频率,从而在保持在热预算内的同时提供较低的性能。

我们强烈建议您构建自己的自定义电源模式,以找到适合您应用和需求的功耗或热稳定性与性能之间的合适平衡。

表 2 比较了 Jetson Orin Nano 4GB 和 8GB 以及 Jetson Orin NX 8GB 和 16GB 在其原始模式和超模式下的详细规格。

ORIN NANO 4GB​ORIN NANO 4GB 
(SUPER)
ORIN NANO 8GBORIN NANO 8GB
(SUPER)
ORIN NX 8GBORIN NX 8GB
(SUPER)
ORIN NX 16GBORIN NX 16GB
(SUPER)
峰值人工智能性能INT820 TOPS (稀疏)​

10 TOPS (Dense)​
34 TOPS(稀疏)

17 TOPS (Dense)
40 TOPS(稀疏)

20 TOPS(密集)
67 TOPS (Sparse)

33 TOPS (Dense)
70 TOPS (稀疏)​

35 TOPS(密集)​
117 TOPS (稀疏)

58 TOPS (Dense)
100 TOPS (稀疏)

50 TOPS (Dense)
157 TOPS (稀疏)

78 TOPS (Dense)
NVIDIA AMPERE GPU 512 CUDA 核心

16 个张量核心

625 MHz 

20/10 INT8 TOPs (S/D)

5 FP16 TFLOPs
512 CUDA 核心

16 张量核心

1020 MHz 

34/17 INT8 TOPs (S/D)

8.5 FP16 TFLOPs
1024 CUDA 核心

32 个张量核心

625 MHz

40/20 INT8 TOPs (S/D)

10 FP16 TFLOPs
1024 个 CUDA 核心

32 个张量核心

1020 MHz 

67/33  INT8 TOPs (S/D)

17 FP16 TFLOPs
1024 CUDA 核心
请提供需要翻译的文本
32 个 Tensor Cores

765 MHz 

50/25 INT8 TOPs (S/D) ​

13 FP16 TFLOPs
1024 CUDA 核心

32 个张量核心

1173 MHz 

77/38 INT8 TOPs (S/D)

19 FP16 TFLOPs
1024 CUDA 核心
请提供要翻译的文本
32 个张量核

918 MHz

60/30 INT8 TOPs (S/D) 

15 FP16 TFLOPs
1024 CUDA 核心

32 个张量核心
请提供需要翻译的文本
1173 MHz

77/38 INT8 TOPs (S/D)

19 FP16 TFLOPs
CPU6X A78​

1.5 GHz
6X A78​

1.7 GHz
6X A78​

1.5 GHz
6X A78

1.7 GHz
6X A78​

2.0 GHz​
6X A78

2.0 GHz
8X A78​2

.0 GHz
8X A78

2.0 GHz
DLA (S/D)NA​NANANA20/10 INT8 TOPs40/20 INT8 TOPs40/20 INT8 TOPs​80/40 INT8 TOPs
DRAM BW34 GB/s51 GB/s68 GB/s102 GB/s102 GB/s102 GB/s102 GB/s102 GB/s
模块电源7W
10W
7W
10W
25W
7W
15W
7W
15W
25W
10W
15W
20W
10W
15W
25W
40W
10W
15W
25W
10W
15W
25W
40W

表 2. Jetson Orin Nano 和 Jetson Orin NX 的原始规格以及超级模式下的规格

在使用新的电源模式时,请确保您产品现有或新的热设计能够满足电源模式的新规格。有关更多信息,请参阅更新的热设计指南

更新的功率估算工具

功率估算工具是 NVIDIA 提供的一个强大工具,通过修改系统参数(如核心、最大频率和 GPU、CPU、DLA 等的负载水平)来创建自定义功率配置文件和nvpmodel配置文件。该工具提供了在各种设置下的估算功耗,并可用于创建最佳参数设置,以实现性能与功耗之间的理想平衡。

我们已经更新了超级模式的电力估算工具。我们强烈建议您使用电力估算工具,并在高性能应用部署之前进行实际验证。

随着 JetPack 6.2 引入超级模式,Jetson Orin Nano 和 Jetson Orin NX 模块提供高达 2 倍的推理性能提升。我们基准测试了最流行的大型语言模型 (LLMs)、视觉语言模型 (VLMs) 和视觉transformer (ViTs)。

大型语言模型

以下图表和表格显示了流行的 LLMs 的超级模式性能基准,如 Llama3.1 8B、Qwen2.5 7B 和 Gemma2 2B。

A bar chart summarizes the performance improvements of seven LLMs when run using Super Mode on the Orin Nano 4GB, Orin Nano 8GB, Orin NX 8GB, and Orin NX 16GB modules. 

图 1. 使用超级模式的 LLMs 性能提升

DNR 意味着模块上的内存不足以运行特定模型。模型性能将受到限制行为的影响。

在下表中,LLM 生成性能(每秒令牌数)在使用 MLC API 的 INT4 量化下进行了测量。

表 3 显示了在 JetPack 6.2 下,Jetson Orin Nano 4GB 上LLM的性能提升。

ModelOrin Nano 8GB(原版)Orin Nano 8GB(超模式)性能提升 (x)
Gemma 2 2B11.4018.601.64
SmolLM2 1.7B23.0035.801.56

表 3. Jetson Orin Nano 4GB 上流行LLMs的基准性能(以令牌/秒计)

表 4 显示了在 JetPack 6.2 下 Jetson Orin Nano 8GB 上LLM的性能提升。

ModelOrin Nano 8GB(原版)Orin Nano 8GB(超模式)性能提升 (x)
Llama 3.1 8B14.0019.101.37
Llama 3.2 3B27.7043.101.55
Qwen 2.5 7B14.2021.801.53
Gemma 2 2B21.535.01.63
Gemma 2 9B7.209.201.28
Phi-3.5 3.8B24.7038.101.54
SmolLM2 1.7B41.0064.501.57

表 4. 在 Jetson Orin Nano 8GB 上流行LLMs的基准性能(以每秒令牌数计)

表 5 显示了在 JetPack 6.2 下,Jetson Orin NX 8GB 上LLM的性能提升。

ModelOrin NX 8GB(原版)Orin NX 8GB(超级模式)性能提升 (x)
Llama 3.1 8B15.9023.101.46
Llama 3.2 3B34.5046.501.35
Qwen 2.5 7B17.1023.801.39
Gemma 2 2B26.6039.301.48
Gemma 2 9B8.8013.381.52
Phi-3.5 3.8B30.8041.301.34
SmolLM2 1.7B51.5069.801.35

表 5. Jetson Orin NX 8GB 上流行LLMs的标杆性能(以每秒令牌数计算)

表 6 显示了在 JetPack 6.2 下,Jetson Orin NX 16GB 上的LLM性能提升。

ModelOrin NX 16GB(原版)Orin NX 16GB(超级模式)性能提升 (x)
Llama 3.1 8B20.5022.801.11
Llama 3.2 3B40.4045.801.13
Qwen 2.5 7B20.8023.501.13
Gemma 2 2B31.6039.001.23
Gemma 2 9B10.5613.261.26
Phi-3.5 3.8B35.9040.901.14
SmolLM2 1.7B59.5068.801.16

表 6. Jetson Orin NX 和 Orin Nano 模块上流行 LLMs 的基准性能(以每秒 tokens 计)

视觉语言模型

以下图表和表格显示了如 VILA1.5 8B、LLAVA1.6 7B 和 Qwen2 VL 2B 等流行 VLM 的超级模式性能基准。

A bar chart summarizes the performance improvements of seven VLMs when run using Super Mode on the Orin Nano 4GB, Orin Nano 8GB, Orin NX 8GB, and Orin NX 16GB modules.

图 2. 在使用超级模式运行时 VLM 的性能提升

DNR 意味着模块上的内存不足以运行特定模型。模型性能将受到限制行为的影响。

表 7 显示了在 JetPack 6.2 下,Jetson Orin Nano 4GB 上的 VLM 性能提升。

ModelOrin Nano 4GB(原版)Orin Nano 4GB(超级模式)性能提升 (x)
PaliGemma2 3B7.211.21.56

表 7. Jetson Orin Nano 4GB 上流行 VLM 的基准性能(以令牌/秒为单位)

表 8 显示了在 JetPack 6.2 下,Jetson Orin Nano 8GB 上 VLM 性能的提升。

ModelOrin NX 16GB(原版)Orin NX 16GB(超级模式)性能提升 (x)
VILA 1.5 3B0.71.11.51
VILA 1.5 8B0.60.81.45
LLAVA 1.6 7B0.40.61.38
Qwen2 VL 2B2.84.41.57
InternVL2.5 4B2.55.12.04
PaliGemma2 3B13.721.61.58
SmolVLM 2B8.112.91.59

表 8. Jetson Orin Nano 8GB 上流行 VLM 的基准性能(以令牌/秒计)

表 9 显示了在 JetPack 6.2 下,Jetson Orin NX 8GB 上的 VLM 性能提升。

ModelOrin NX 16GB(原版)Orin NX 16GB(超级模式)性能提升 (x)
VILA 1.5 3B0.811.25
VILA 1.5 8B0.71.041.50
LLAVA 1.6 7B0.51.22.54
Qwen2 VL 2B3.44.81.41
InternVL2.5 4B34.11.37
PaliGemma2 3B17.123.91.40
SmolVLM 2B9.714.41.48

表 9. Jetson Orin NX 16GB 上流行 VLM 的基准性能(以每秒令牌数计)

表 10 显示了使用 JetPack 6.2 的 Jetson Orin NX 16GB 上的 VLM 性能提升。

ModelOrin NX 16GB(原版)Orin NX 16GB(超级模式)性能提升 (x)
VILA 1.5 3B11.31.23
VILA 1.5 8B0.811.25
LLAVA 1.6 7B0.60.71.07
Qwen2 VL 2B44.81.20
InternVL2.5 4B2.84.41.57
PaliGemma2 3B2023.81.19
SmolVLM 2B11.714.31.22

表 10. Jetson Orin NX 和 Orin Nano 模块上流行 VLM 的基准性能(每秒令牌数)

所有 VILA 和 LLAVA 模型使用 MLC 以 INT4 精度运行,而其余模型使用 Hugging Face Transformers 以 FP4 精度运行。

视觉transformer

以下图表和表格展示了流行的 ViTs(如 CLIP、DINO 和 SAM2)的超级模式性能基准。

A bar chart summarizes the performance improvements of seven ViTs when run using Super Mode on the Orin Nano 4GB, Orin Nano 8GB, Orin NX 8GB and Orin NX 16GB modules.

图 3. 在使用超级模式运行时,ViTs 的性能提升

DNR 意味着模块上的内存不足以运行特定模型。模型性能将受到限制行为的影响。

表 11 显示了在 JetPack 6.2 下,ViT 在 Jetson Orin Nano 4GB 上的性能提升。

ModelOrin Nano 4GB(原版)Orin Nano 4GB(超级模式)性能提升 (x)
clip-vit-base-patch32126.8189.51.49
clip-vit-base-patch1663.2112.41.78
DINOv2-base-patch1449.379.31.61
SAM2 基础2.53.81.54
vit-base-patch16-22462.4103.31.66

表 11. Jetson Orin Nano 4GB 上流行 ViT 的基准性能(以 token/秒为单位)

表 12 显示了在 JetPack 6.2 下,ViT 在 Jetson Orin Nano 8GB 上的性能提升。

ModelOrin Nano 8GB(原版)Orin Nano 8GB(超模式)性能提升 (x)
clip-vit-base-patch321963141.60
clip-vit-base-patch16951611.69
DINOv2-base-patch14751261.68
SAM2 基础4.46.31.43
Grounding DINO4.16.21.52
vit-base-patch16-224981581.61
vit-base-patch32-2241712731.60

表 12. Jetson Orin Nano 8GB 上流行 ViTs 的每秒标记基准性能

表 13 显示了在 JetPack 6.2 下,ViT 在 Jetson Orin NX 8GB 上的性能提升。

ModelOrin NX 8GB(原版)Orin NX 8GB(超级模式)性能提升 (x)
clip-vit-base-patch32234.0361.11.54
clip-vit-base-patch16101.7204.32.01
DINOv2-base-patch1481.4160.31.97
SAM2 基础3.97.41.92
Grounding DINO4.27.41.75
vit-base-patch16-22498.6192.51.95
vit-base-patch32-224193.1313.51.62

表 13. Jetson Orin NX 8GB 上流行 ViT 的基准性能(以每秒令牌数为单位)

表 14 显示了在 JetPack 6.2 下,ViT 在 Jetson Orin NX 16GB 上的性能提升。

ModelOrin NX 16GB(原版)Orin NX 16GB(超级模式)性能提升 (x)
clip-vit-base-patch32323.2356.71.10
clip-vit-base-patch16163.5193.61.18
DINOv2-base-patch14127.5159.81.25
SAM2 基础6.27.31.18
Grounding DINO6.27.21.16
vit-base-patch16-224158.6190.21.20
vit-base-patch32-224281.2309.51.10

表 14. Jetson Orin NX 16GB 上流行 ViT 的基准性能(帧/秒)

所有的 ViT 模型均使用 NVIDIA TensorRT 以 FP16 精度运行,测量单位为 FPS。

开始使用 NVIDIA Jetson Orin Nano 和 Jetson Orin NX 及 JetPack 6.2

NVIDIA Jetson 生态系统提供了多种方法让您使用 JetPack 镜像为开发者套件和生产模块刷机。

要在 Jetson Orin Nano 开发套件或模块上安装 JetPack 6.2,请使用以下方法之一:

新的闪光配置

新的电源模式仅在新的闪烁配置下可用。默认的闪烁配置没有改变。要启用新的电源模式,您必须在闪烁时使用新的闪烁配置。

这是用于刷写的新闪存配置:

jetson-orin-nano-devkit-super.conf

在闪存或更新到 JetPack 6.2 后,运行以下命令以启动新可用的超级模式。

MAXN SUPER 模式在 Jetson Orin Nano 模块上:

sudo nvpmodel -m 2

MAXN SUPER 模式在 Jetson Orin NX 模块上:

sudo nvpmodel -m 0

您还可以从页面右上角的电源模式菜单中选择 MAXN SUPER 和其他电源模式。

Four screenshots show the expanded Power mode menu on the Jetson Orin Nano and Jetson Orin NX modules.

图 4. 功率模式选择菜单

<think>好的,我现在需要帮助用户解决如何将Jetson Nano上的JetPack更新到6.2版本的问题。首先,我要回想一下用户提供的参考信息,特别是引用[1]、[2]、[3]中的内容。 根据引用[1],用户之前遇到了安装JetPack 6的问题,错误是“E: Unable to correct problems, you have held broken packages”,解决办法是恢复默认的sources.list文件。这说明在更新或安装JetPack时,软件源配置可能引起依赖问题,需要注意这一点。 引用[2]提到Jetson Nano的系统是Ubuntu 20.04,并且安装DeepStream需要特定版本的JetPack。而用户现在想升级到JetPack 6.2,可能需要确认JetPack 6.2是否支持Ubuntu 20.04,或者是否需要升级系统到更高版本的Ubuntu,比如22.04。因为通常JetPack版本与Ubuntu版本是绑定的,比如JetPack 5可能对应Ubuntu 20.04,而JetPack 6可能需要Ubuntu 22.04。这可能导致用户需要先升级系统,再进行JetPack安装。 引用[3]中用户安装了DeepStream 5.1,使用的是JetPack 6.0.1,但用户现在想升级到JetPack 6.2。这里可能存在版本兼容性问题,需要检查DeepStream 6是否与JetPack 6.2兼容,或者是否需要升级DeepStream版本。 接下来,我需要整理步骤: 1. 检查JetPack 6.2的系统要求,尤其是Ubuntu版本。假设JetPack 6.2需要Ubuntu 22.04,而当前Jetson Nano可能运行的是20.04,因此可能需要先升级系统。 2. 备份重要数据,因为系统升级可能导致数据丢失或配置变更。 3. 更新软件源,可能恢复默认的sources.list,如引用[1]提到的,避免软件包冲突。 4. 执行系统升级到Ubuntu 22.04,这可能需要使用官方提供的烧录工具,比如SDK Manager,或者通过OTA升级,但需要确认Jetson Nano是否支持OTA升级到22.04。 5. 安装JetPack 6.2,可能需要通过SDK Manager重新刷写系统镜像,因为JetPack通常作为完整的SDK提供,包含OS、驱动、库等,而不是简单的apt升级。 6. 安装后的配置,包括DeepStream的兼容性检查,根据引用[3],可能需要下载对应JetPack 6.2的DeepStream版本,并按照安装步骤进行。 注意事项包括:确保电源稳定,备份数据,检查硬件兼容性,处理可能出现的依赖问题,以及安装后测试各项功能是否正常。 可能的问题:用户可能误以为JetPack可以通过apt直接升级,但实际上可能需要重新刷写系统。另外,Jetson Nano的硬件是否支持JetPack 6.2也是一个疑问,需要查阅官方文档确认Nano是否在支持列表中。例如,某些新版本的JetPack可能只支持更新的硬件,如Orin系列,而Nano可能最高支持到JetPack 4.x或5.x。这一点非常关键,如果Nano不支持JetPack 6.2,用户的升级尝试将失败。 因此,需要先核实Jetson Nano是否支持JetPack 6.2。查阅NVIDIA官方文档,发现Jetson Nano通常支持到JetPack 4.6或5.x,而JetPack 6.x可能仅适用于Orin等新一代模块。如果确实不支持,用户可能需要考虑硬件升级,或者寻找替代方案。 但假设用户的信息可能有误,或者存在特殊情况,比如社区提供的非官方支持。这时候需要明确告知用户官方支持情况,避免误导。 总结步骤: 1. 确认Jetson Nano是否官方支持JetPack 6.22. 如不支持,告知用户无法升级。 3. 如支持,指导用户通过SDK Manager刷写新镜像。 4. 处理可能遇到的依赖问题,如恢复默认源。 5. 安装后配置验证。 需要检查官方资源,比如NVIDIA Jetson Nano的产品页面或开发者论坛,确认兼容性。例如,NVIDIA官方可能列出JetPack 6.2支持的设备,如果Nano不在其中,则无法升级。</think>根据问题描述引用内容,Jetson Nano升级JetPack 6.2需注意以下关键点: ### 一、Jetson NanoJetPack 6.2的兼容性验证 1. **硬件限制**: Jetson Nano的官方支持最高到JetPack 4.6.1(基于Ubuntu 18.04),而JetPack 6.2需要Ubuntu 22.04环境且主要支持Jetson Orin系列[^1][^2]。因此**Jetson Nano无法通过官方途径升级到JetPack 6.2**。 2. **替代方案**: 若需使用JetPack 6.2,需更换硬件(如Jetson Orin NX),或通过容器/Docker尝试非官方移植(存在兼容性风险)。 --- ### 二、JetPack版本升级的通用流程(适用于支持设备) 假设设备支持目标版本(如Jetson Orin NX升级JetPack 6.2): 1. **备份数据**: 使用`sudo nvpmodel -q`保存当前功耗配置,备份`/etc/apt/sources.list`等关键文件[^1]。 2. **系统镜像刷写**: 通过NVIDIA SDK Manager选择JetPack 6.2镜像,连接设备进入恢复模式强制刷写[^2]。 3. **依赖修复**: 刷写后若出现`E: Unable to correct problems`错误,需恢复默认软件源: ```bash sudo cp /etc/apt/sources.list.bak /etc/apt/sources.list # 引用[1]方案 sudo apt update ``` 4. **验证安装**: 检查CUDA版本: ```bash nvcc --version ``` --- ### 三、DeepStream的版本匹配 若强行在Jetson Nano上安装非官方JetPack版本: - DeepStream需匹配JetPack版本,例如DeepStream 6.x需JetPack 6.x[^3]。 - 安装命令需调整路径: ```bash sudo tar -xvf deepstream_sdk_v6.2_jetson.tbz2 -C / # 替换为对应版本 ``` --- ###
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值