算力怪兽Jetson Thor!正在让机器人大踏步从工厂走进生活

8月25日,NVIDIA正式宣布Jetson AGX Thor开发者套件和量产级模组全面发售。这一基于Blackwell架构的机器人计算机不仅代表了NVIDIA Jetson系列的最新巅峰,更标志着通用机器人时代的重要里程碑。

Jetson Thor以其前所未有的AI算力和能效表现,正在重新定义机器人与人类及物理世界的交互方式,为通用机器人的大规模商业化应用铺平道路。

从嵌入式AI到通用机器人,Jetson的十年长征路

要理解Jetson Thor的革命性意义,我们先回溯NVIDIA Jetson平台的发展历程。自2014年首次推出以来,Jetson系列已经经历了多次重大技术革新,每一代产品都在推动着边缘AI和机器人技术的边界。

回看2014-2015年,那还是嵌入式AI的萌芽期。NVIDIA Jetson TK1的诞生标志着嵌入式AI计算的开端——这款搭载Tegra K1 SoC的开发板虽然仅有0.327 TFLOPS的算力,却首次将GPU加速的AI计算能力带入了嵌入式领域。

紧随其后的Jetson TX1将算力提升至1.024 TFLOPS(FP16),为早期的机器人视觉和感知应用奠定了基础。

2017-2018年迎来了专业级机器人计算的突破。2017年发布的Jetson TX2引入了Pascal架构GPU,将AI算力提升至1.333 TFLOPS;而2018年发布的Jetson AGX Xavier则是一次质的飞跃——30 TOPS的INT8算力、专用的深度学习加速器(DLA)以及8核Carmel CPU,使其成为当时最强大的嵌入式AI计算平台。

2019-2022年见证了AI计算的民主化。Jetson Nano的推出以极低的价格(99美元)将AI计算能力带入了创客和教育领域,推动了AI技术的普及化。

而Jetson Orin系列的发布则重新定义了嵌入式AI的性能标准——从Orin Nano的40 TOPS到AGX Orin的275 TOPS,算力提升了近7倍,为复杂的机器人应用提供了可能。

如今,Jetson Thor的问世将这一进化推向了新的高度。基于Blackwell架构的Thor不仅将AI算力提升至2070 FP4 TFLOPS,更重要的是,它专门为物理AI和通用机器人设计,解决了机器人技术中最核心的挑战:实时、智能的人机交互和物理世界理解。

NVIDIA Jetson系列演进历程

Blackwell架构,为物理AI带来强大计算引擎

Jetson Thor的核心竞争力源于其搭载的Blackwell GPU架构。与专为数据中心设计的Hopper架构不同,Blackwell在保持强大算力的同时,特别优化了能效比和实时推理能力,使其成为物理AI应用的理想选择。

Blackwell架构的第五代Tensor Core是Jetson Thor强大算力的源泉。与上一代Ampere架构相比,Blackwell Tensor Core引入了多项关键创新:FP4精度支持在保持模型精度的同时,将计算吞吐量提升至FP8的两倍;稀疏计算优化通过结构化稀疏性进一步提升计算效率;动态精度调整根据计算需求动态切换不同精度。

Jetson Thor的Blackwell GPU在架构设计上充分考虑了机器人应用的特殊需求:低延迟推理引擎确保推理延迟控制在毫秒级别;多模态并行处理支持同时处理视觉、语音、触觉等多种传感器数据;在130W功耗范围内实现2070 TFLOPS算力,能效比较上一代提升3.5倍

Jetson Thor不仅是一个强大的GPU,更是一个完整的计算生态系统:14核Arm Neoverse V3AE CPU提供高达2.6GHz的主频;128GB LPDDR5X内存确保大规模AI模型和数据的高效处理;4×25GbE网络接口支持高速传感器数据传输;PCIe Gen5支持为未来扩展提供充足带宽。

Jetson Thor与AGX Orin技术规格对比

实时智能交互,从实验室到现实世界

Jetson Thor最革命性的贡献在于它解决了机器人技术中最根本的挑战:如何实现机器人与人类及物理世界的实时、智能交互。

传统的机器人系统通常采用模块化设计,视觉感知、语音理解、运动控制等功能分别由不同的子系统处理,带来了延迟增加、信息孤岛等问题。Jetson Thor通过其强大的计算能力和统一的软件架构,实现了真正的多模态融合。

视觉-语言-动作一体化基于Isaac GR00T N1.5等视觉语言动作模型,Jetson Thor能够同时处理视觉输入、语言指令和动作输出。通过Holoscan传感器桥技术,以40ms的端到端延迟处理多路传感器数据。借助大规模语言模型和视觉语言模型,机器人能够理解复杂的场景上下文和人类意图。

Jetson Thor的强大算力使其能够在边缘设备上运行多个生成式AI模型:零样本学习让机器人无需针对每个具体任务进行专门训练;基于大语言模型,机器人能够理解复杂的自然语言指令;当面对未知情况时,机器人可以利用生成式AI模型创造性地解决问题。

在机器人应用中,实时性至关重要。Jetson Thor通过多项技术创新实现了前所未有的实时推理能力:通过精心设计的计算流水线,能够在处理当前帧数据的同时准备下一帧的计算资源;系统能够根据任务复杂度动态调整计算资源分配;基于对机器人运动和环境变化的预测,提前计算可能需要的感知和控制结果。

Jetson Thor的发布不仅是技术上的突破,更重要的是它标志着NVIDIA机器人生态系统的成熟。经过十余年的发展,NVIDIA已经构建了一个从芯片到软件、从云到边缘的完整机器人技术栈,吸引了超过200万开发者和150多家合作伙伴。

与Jetson Thor硬件平台相辅相成的是NVIDIA的Isaac GR00T机器人基础模型。这个专门为通用机器人设计的基础模型平台包括:Isaac GR00T N1.5最新的开放人形机器人基础模型;GR00T-Gen用于生成多样化、逼真的仿真环境;GR00T-Dexterity端到端的像素到动作抓取系统;GR00T-Mobility基于强化学习和模仿学习的移动能力增强系统;GR00T-Control全身控制库、模型和策略套件;GR00T-Perception集成视觉语言模型、大语言模型和检索增强记忆。

全球领先的机器人企业正在采用 Jetson Thor 驱动下一代机器人。

宇树科技创始人兼首席执行官王兴兴:Jetson Thor带来了计算能力的巨大飞跃,赋能机器人更强的敏捷性、更快的决策制定以及更高的自主水平;

银河通用创始人兼首席技术官王鹤:通过Jetson Thor显著提升G1 Premium机器人的运动速度和动作流畅性。

宇树Unitree G1

Jetson Thor的强大性能使其能够支持多种复杂的应用场景:在人形机器人领域实现实时控制、环境理解、自然语言交互;在手术辅助机器人领域实现高精度控制、实时影像分析;在工业自动化领域实现质量检测、预测性维护;在农业机器人领域实现作物监测、精准农业;在物流机器人领域实现路径规划、物体识别。

Jetson Thor主要应用场景与技术需求

卓越性背后的创新之处

Jetson Thor的卓越性能源于Blackwell架构的多项技术创新。与传统的GPU架构不同,Blackwell从设计之初就考虑了物理AI和机器人应用的特殊需求。

Transformer模型在自然语言处理和计算机视觉领域取得了巨大成功,但其在机器人应用中的实时推理一直面临挑战。Blackwell架构的第二代Transformer引擎专门针对这一问题进行了优化:动态精度调整根据模型的不同层和计算需求,动态选择最适合的数值精度;注意力机制加速专用的硬件单元加速Transformer模型中的注意力计算;内存访问优化通过智能的数据预取和缓存策略,减少内存访问延迟。

FP4(4位浮点)精度的引入是Blackwell架构最重要的创新之一。在传统的深度学习中,FP32是标准精度,FP16和INT8被用于推理加速。而FP4将这一趋势推向了极致:存储效率提升将模型参数的存储需求减少到FP32的1/8;计算吞吐量翻倍在相同的硬件资源下,FP4计算能够达到FP8两倍的吞吐量;精度保持技术通过先进的量化技术和校准方法,FP4能够在大幅提升性能的同时保持模型精度。

在机器人应用中,系统的可靠性至关重要。Blackwell架构引入了RAS(Reliability, Availability, Serviceability)引擎,为关键任务应用提供了企业级的可靠性保障:错误检测与纠正实时检测内存和计算错误,并自动进行纠正;冗余设计关键组件的冗余设计确保在部分硬件失效时系统仍能正常运行;预测性维护通过监控硬件状态和使用模式,预测可能的故障并提前预警。

机器人应用通常需要处理大量的传感器数据,这些数据往往经过压缩以节省存储和传输带宽。Blackwell架构的解压缩引擎专门针对这一需求进行了优化:多格式支持支持常见的压缩格式,包括JPEG、PNG、H.264、H.265等;硬件加速专用的硬件解压缩单元大幅提升数据处理速度,减少CPU负担;零拷贝传输解压缩后的数据直接传输到GPU内存,避免不必要的内存拷贝,降低延迟。

当算力瓶颈继续突破,当交互不再是难题,机器人终于可以从工厂走向生活,从工具进化为伙伴。

END

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值