MobileNet-SSD训练VOC0712

博客主要介绍了Caffe深度学习环境的安装步骤,包括使用sudo apt-get命令安装多个开发库,还设置了环境变量,如PATH、LD_LIBRARY_PATH等。此外,提到了使用pip安装依赖,以及针对GPU显存不足时修改图片参数和相关脚本文件参数的内容。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

sudo apt-get install libprotobuf-dev -y
sudo apt-get install libleveldb-dev -y
sudo apt-get install libsnappy-dev -y
sudo apt-get install libopencv-dev -y
sudo apt-get install libhdf5-serial-dev -y
sudo apt-get install protobuf-compiler -y
sudo apt-get install libgflags-dev -y
sudo apt-get install libgoogle-glog-dev -y
sudo apt-get install liblmdb-dev -y
sudo apt-get install libatlas-base-dev -y
sudo apt-get install --no-install-recommends libboost-all-dev -y

echo INCLUDE_DIRS := $(PYTHON_INCLUDE) /usr/local/include /usr/local/cuda/include /usr/include/hdf5/serial
echo LIBRARY_DIRS := $(PYTHON_LIB) /usr/local/lib /usr/lib /usr/local/cuda/lib64 /usr/lib/x86_64-linux-gnu/hdf5/serial

export PATH=/usr/local/cuda/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH
export CAFFE_ROOT=/home/song/src/caffe
export PYTHONPATH=/home/song/src/caffe/python:$PYTHONPATH

echo song@song:~/src/caffe/python$ sudo pip install -r requirements.txt

echo GPU显存不足9G的修改图片参数从300到200 285到185 /home/song/src/caffe/examples/MobileNet-SSD/example/*.prototxt
echo /home/song/src/caffe/data/VOC0712/create_data.sh:12 修改 min_dim=1 max_dim=3 width=200 height=200
 

<think>好的,用户想知道如何标注MobileNet-SSD训练集,需要了解标注工具、方法和教程。首先,我需要回忆MobileNet-SSD的基本要求。MobileNet-SSD是基于SSD框架的目标检测模型,所以训练集需要包含物体位置和类别标签,通常使用边界框(Bounding Box)标注。 接下来,用户提到的标注工具,常见的有LabelImg、LabelMe、CVAT等。需要确认这些工具是否适合生成PASCAL VOC格式或COCO格式,因为MobileNet-SSD通常使用VOC格式的数据集。例如,引用[3]提到需要修改.prototxt文件中的数据集路径,可能涉及到VOC的数据结构。 然后,标注方法方面,要说明标注的步骤:安装工具、创建标签、标注边界框、导出XML文件(VOC格式)。可能还需要数据增强或转换,比如转换成LMDB格式,不过用户现在可能只需要标注部分的信息。 关于教程,引用[5]提到下载MobileNet-SSD的源码,里面可能有准备数据集的说明。另外,引用[3]中的gen_model.sh脚本生成训练文件,但用户需要先准备好标注数据。可能需要指导用户如何将标注好的数据整理成VOC结构,并修改prototxt中的路径。 还要考虑用户可能遇到的问题,比如标注工具的输出格式是否正确,如何划分训练集和验证集,以及数据预处理的要求。例如,MobileNet-SSD的输入尺寸通常是300x300,是否需要调整图片大小,或者标注时注意比例。 此外,用户可能不知道标注后的数据如何转换为训练所需的格式,比如是否需要使用脚本将VOC转换为LMDB,或者直接使用已有的脚本。引用[4]提到TFLite的转换,但用户当前的问题在标注阶段,可能暂时不需要涉及模型转换,但后续步骤可能需要。 需要检查是否有引用中的信息可以直接帮助用户。比如引用[3]提到修改输入数据集路径和图片尺寸,说明用户需要正确设置数据集的位置和参数。所以在回答中应该强调标注后的数据组织结构,以及配置文件中的对应路径修改。 最后,生成相关问题时要围绕标注工具的使用、数据准备流程、格式转换和训练配置,帮助用户全面了解整个过程。</think>针对MobileNet-SSD目标检测算法的训练集标注,需遵循以下标准化流程: ### 一、标注工具选择 1. **LabelImg**(推荐) - 支持PASCAL VOC格式输出(XML文件) - 快捷键操作提升效率:$W$创建框,$Ctrl+S$保存 - 安装命令: ```bash pip install labelImg ``` 2. **CVAT**(复杂场景适用) - 支持多人协作标注 - 可导出COCO/VOC格式 3. **LabelMe** - 支持多边形标注 - 需转换脚本适配矩形框检测任务 ### 二、标注规范 1. **边界框要求** - 完全包裹目标物体 - 长宽比例建议保持$1:1$至$5:1$(适配MobileNet-SSD的默认anchor设置) 2. **文件结构** ```bash VOC2007/ ├── Annotations # XML标注文件 ├── ImageSets │   └── Main # 训练/验证集划分文件 └── JPEGImages # 原始图像 ``` ### 三、标注流程 1. 创建`classes.txt`定义类别ID对应关系: ``` hand 0 face 1 ``` 2. 执行标注时注意: - 单图标注时间建议控制在$t \leq 30s$ - 标注误差应满足$\Delta x/y \leq 0.5\% \times 图像宽度/高度$ 3. 生成数据集划分文件: ```python import random trainval_percent = 0.9 with open('ImageSets/Main/trainval.txt','w') as f: [f.write(f"{img_id}\n") for img_id in random.sample(img_list, int(len(img_list)*trainval_percent))] ``` ### 四、格式转换 需将VOC格式转换为Caffe训练所需的LMDB格式(引用[3]): ```bash $CAFFE_ROOT/scripts/create_data.sh VOC2007 ``` 此过程会生成: $$ \text{lmdb文件} = \text{图像数据} \oplus \text{标注信息} $$
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

weixin_35867652

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值