在Seeed Studio reComputer Jetson Orin使用英伟达最新发布的VLM视觉语言大模型
所有教程都免费开源,请动动小手点个小星星https://github.com/Seeed-Projects/jetson-examples
简介
视觉语言模型(VLMs)是支持图像、视频和文本的多模态模型,它们结合了大型语言模型和视觉变换器。基于这一能力,它们能够支持通过文本提示来查询视频和图像,从而实现与视频聊天、定义基于自然语言的警报等功能。VLM AI服务能够快速部署VLMs,以用于视频洞察应用。VLM服务公开了REST API端点,用于配置视频流输入、设置警报并以自然语言询问关于输入视频流的问题。
本教程将指导如何在Seeed Studio reComputer J4012 Jetson Orin NX上运行VLM。
在reComputer Jetson Orin使用英伟达最新发布的VLM视觉语言大模型
要求
在开始设置过程之前,请确保您的系统满足以下前提条件:

- 运行Ubuntu
22.04
或更高版本的Seeed Studio reComputer J4012 Orin NX 16G。 - 驱动版本:
535.113.01
,Jetpack版本:6.0
,CUDA版本:12.2
。 - 确保已安装JetPack和相关的Jetson服务包。
sudo apt-get install nvidia-jetpack sudo apt install nvidia-jetson-services
- 可以通过RTSP流传输IP摄像头或本地视频(推荐使用我们的