Jetson-inference项目实战：使用camera-capture工具构建自定义分类数据集-优快云博客

本文链接：https://blog.youkuaiyun.com/gitblog_00930/article/details/148440880

Jetson-inference项目实战：使用camera-capture工具构建自定义分类数据集

jetson-inference jetson-inference: 提供了一个用于NVIDIA Jetson设备的深度学习推理和实时视觉DNN库，支持多种深度学习模型和应用。项目地址: https://gitcode.com/gh_mirrors/je/jetson-inference

前言

在深度学习项目中，高质量的数据集是模型成功的关键因素。对于Jetson开发者而言，jetson-inference项目提供的camera-capture工具极大地简化了自定义数据集的收集过程。本文将详细介绍如何利用这一工具创建专属于你的图像分类数据集。

数据集结构设计

在开始收集数据前，我们需要了解PyTorch训练脚本期望的数据组织结构。一个标准的分类数据集应包含以下目录结构：

‣ train/            # 训练集
	• class-A/       # 类别A的图片
	• class-B/       # 类别B的图片
	• ...            # 其他类别
‣ val/              # 验证集
	• class-A/
	• class-B/
	• ...
‣ test/             # 测试集
	• class-A/
	• class-B/
	• ...

这种结构确保了数据在训练、验证和测试阶段都能被正确访问和处理。

创建标签文件

标签文件是数据集的核心定义文件，它决定了数据集的类别构成：

在jetson-inference/python/training/classification/data目录下创建你的数据集目录
在该目录中创建labels.txt文件
按字母顺序每行写入一个类别名称

示例labels.txt内容：

background
brontosaurus
tree
triceratops
velociraptor

重要提示：标签文件的字母顺序必须与后续自动生成的子目录顺序一致，否则会导致类别错乱。

启动camera-capture工具

camera-capture工具支持多种输入源，以下是常见用法示例：

# 使用MIPI CSI摄像头
$ camera-capture csi://0

# 使用V4L2摄像头
$ camera-capture /dev/video0

工具启动后，你将看到实时视频流界面和数据采集控制面板。

数据采集实战技巧

1. 初始化设置

在数据采集控制面板中：

选择数据集存储路径
加载之前创建的标签文件
确保"Dataset Type"设置为"Classification"

2. 采集策略

训练集：建议每个类别至少收集100张图片
验证集：约为训练集的10-20%
测试集：根据实际需求决定数量

3. 数据多样性

为确保模型鲁棒性，采集时应注意：

不同物体朝向
多种相机视角
变化的光照条件
多样的背景环境

4. 高效采集技巧

使用空格键快速捕捉图像
实时查看已采集数量（显示在状态栏）
可随时切换类别和数据集类型

模型训练与验证

完成数据采集后，按照标准流程训练模型：

$ cd jetson-inference/python/training/classification
$ python3 train.py --model-dir=models/<你的模型目录> data/<你的数据集目录>

内存优化建议：

增加SWAP空间
关闭桌面GUI
减小batch size和workers数量

模型导出与应用

训练完成后，将模型导出为ONNX格式：

$ python3 onnx_export.py --model-dir=models/<你的模型目录>

导出后的模型可用于推理：

# C++版本推理
imagenet --model=models/<你的模型目录>/resnet18.onnx --labels=data/<你的数据集目录>/labels.txt csi://0

# Python版本推理
imagenet.py --model=models/<你的模型目录>/resnet18.onnx --labels=data/<你的数据集目录>/labels.txt csi://0