NVIDIA NVLink Fusion 是 PCIe Gen5 的 14 倍

领先的超大规模企业皆已开始部署 NVIDIA NVLink 整机架解决方案,可以通过 NVLink Fusion 在 NVIDIA 机架架构上实现异构芯片数据中心标准化,从而加快上市速度。

NVIDIA NVLink™ Fusion 可为自定义加速器或自定义 CPU 提供行业领先的 AI 性能扩展。借助强健的 NVIDIA 合作伙伴生态系统,超大规模企业可以使用 NVIDIA NVLink 和 AI 工厂技术构建通用 AI 基础设施,这些技术包括机架级扩展架构、NVIDIA GPU 或 NVIDIA Grace™ CPU、光电一体封装的硅光 (CPO) 交换机、ConnectX® SuperNIC、BlueField® DPU 和 Mission Control。

NVLink Fusion的优势.JPG

NVLink Fusion的优势

NVIDIA 展示了 NVLink Fusion 的重大突破,这是一种针对 AI 数据中心优化的技术。在 Computex 上亮相的新一代产品可实现令人印象深刻的带宽,同时促进与行业领导者的合作。详细了解这项创新对技术生态系统的影响。

NVIDIA 于 2014 年开发 NVLink,作为连接服务器和数据中心中 GPU 和其他计算元素的替代技术。与 PCI Express 不同,NVLink 连接的设备使用网状网络通信,而不是依赖中央集线器。今天,NVIDIA 为下一代 AI 数据中心推出了增强的解决方案。

NVLink At Scale Performance.JPG

NVIDIA 解释说,NVLink Switch 芯片可以在 72 加速器 NVLink 域 (NVL72) 中提供 130 TB/s 的带宽,而 NVLink-C2C 芯片到芯片互连可用于创建新的集成产品。

NVLink Fusion 预计将为芯片和 ASIC 构建商提供许多定制选项。同时,NVIDIA 通过其 Mission Control 软件组件提供高度集成的产品堆栈。借助这个统一的控制中心,企业客户可以自动执行运行现代化 AI 基础设施所需的复杂管理任务。

在今年的 Computex 上,NVIDIA 展示了其新一代 NVLink 互联技术。这项名为 NVLink Fusion 的技术旨在支持半定制的 AI 基础设施和数据中心部署。该公司已经与众多希望在其产品中采用这种新芯片的行业领导者合作。

智算中心技术架构.JPG

智算中心技术架构

为了以节能高效的方式更大限度地提高 AI 工厂的吞吐量和性能,与新的 Blackwell Ultra GPU 一起,NVLink Fusion 是 NVIDIA “AI 工厂”愿景的关键部分。第五代 NVIDIA NVLink 平台应用于 NVIDIA Grace Blackwell 计算密集型机架:GB200 NVL72 和 GB300 NVL72。NVLink Fusion 和 NVIDIA 的专用机架相结合,为每个 GPU 提供 1.8 TB/s的总带宽,比 PCIe 5.0 快 14 倍。

“一场翻天覆地的变革正在发生:数据中心架构数十年来首度必须从根本上彻底改变—— AI 正在融入每个计算平台。NVLink Fusion 将 NVIDIA AI 平台和丰富的生态系统对外开放,助力合作伙伴构建专用 AI 基础设施。” NVIDIA 创始人兼首席执行官黄仁勋表示。

LANHY 二维码.JPG

#NVIDIA #NVLink Fusion #GPU算力#数据中心#GB#Blackwell#NVL72

   

### NVIDIA Jetson NX 上部署 VINS-Fusion-GPU 的教程 #### 环境准备 为了成功在 NVIDIA Jetson Xavier NX 开发板上部署 VINS-Fusion-GPU,需先完成必要的环境配置。目标操作系统为 Ubuntu 18.04,并确保 CUDA 工具链已正确安装。 CUDA 是 NVIDIA 提供的一个并行计平台和编程模型,用于加速基于 GPU 的应用程序开发。对于 Jetson Xavier NX 板而言,推荐使用的 CUDA 版本为 Cuda 10.2[^2]。以下是具体操作命令: ```bash sudo apt-get update sudo apt-get install cuda-toolkit-10-2 ``` 上述命令会更新包管理器索引并将指定版本的 CUDA 安装到系统中。 #### 软件依赖项安装 除了基础的 CUDA 支持外,还需要额外安装一些软件库来支持 VINS-Fusion 的编译与运行。这些依赖项可以通过以下方式获取: ```bash sudo apt-get install ros-melodic-desktop-full python-catkin-tools cmake build-essential libeigen3-dev libsuitesparse-dev coinor-libipopt-dev qtbase5-dev libopencv-dev ``` 以上命令涵盖了 ROS (Robot Operating System)、CMake 构建工具以及 OpenCV 和其他数学运所需的头文件和支持库[^3]。 #### 获取源码 下载适合 GPU 加速优化过的 VINS-Fusion 源代码仓库至本地目录下。通常可以从项目官方 GitHub 或者经过验证的第三方分支地址克隆最新稳定版代码: ```bash cd ~/ git clone https://github.com/TixiaoShan/VINS-Mono.git vins_fusion_gpu_master mv vins_fusion_gpu_master /home/jetson/offboard_ws/src/VINS-Fusion-gpu-master ``` 这里假设工作空间路径设置为 `/home/jetson/offboard_ws`,实际可根据个人习惯调整存储位置。 #### 编译构建流程 进入 Catkin 工作区根目录执行 catkin_make 命令启动整个项目的交叉编译过程: ```bash source /opt/ros/melodic/setup.bash cd ~/offboard_ws catkin_make_isolated --install -DCMAKE_BUILD_TYPE=Release ``` 此阶段可能会遇到因硬件资源不足引发的各种错误提示;如果发现 CPU 性能瓶颈明显影响进度,则可考虑适当减少并发作业数以缓解压[^1]。 #### 测试运行效果 当所有组件都顺利通过链接测试之后即可尝试加载预定义参数集进行初步功能检验。例如,在终端输入如下指令调用默认节点实例化服务端口监听状态: ```bash roslaunch vins_estimator mono_inertial.launch ``` 此时应该能够观察到来自摄像头传感器数据流被实时处理后的位姿估计结果输出日志信息显示于屏幕之上。 --- ###
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值