TensorFlow on Android（9）: 运行一个DEMO

最新推荐文章于 2022-01-14 17:20:17 发布

原创最新推荐文章于 2022-01-14 17:20:17 发布 · 625 阅读

0 ·

CC 4.0 BY-SA版权

AI和物联网专栏收录该内容

10 篇文章

订阅专栏

本文介绍如何使用ObjectDetectionAPI训练识别宠物的模型，包括环境配置、数据集准备、转移学习及训练过程。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在Object Detection API的示例代码中包含了一个训练识别宠物的Demo，包括数据集和相应的一些代码。虽然本系列中我们会自己准备数据和脚本来进行训练，但是在这之前我们还需要安装一些库，配置一下环境。在配置完成之后，我们可以运行一下这个训练宠物的Demo，以便检查我们的环境配置是否OK，同时对训练过程有先有个整体的了解，然后我们再准备自己的数据和训练脚本。

请确保已经安装好了Python 2.7

安装Object Detection API

首先下载Object Detection API的代码

git clone https://github.com/tensorflow/models.git

然后安装TensorFlow(本系列文章使用tensorflow 1.3.0 )

sudo pip install tensorflow==1.3.0

接着是一些依赖库

sudo pip install pillow
sudo pip install lxml
sudo pip install jupyter
sudo pip install matplotlib

Object Detection API中的模型和训练参数是使用protobuf来序列化和反序列化的，所以在运行之前需要将相应的protobuf文件编译出来

#进入 tensorflow/models/research/
protoc object_detection/protos/*.proto --python_out=.

成功编译以后可以在object_detection/protos/ 下找到生成.py和.pyc文件

接下来将Object Detection API的库加入到PYTHONPATH中

#进入 tensorflow/models/research/
export PYTHONPATH=$PYTHONPATH:`pwd`:`pwd`/slim

运行Object Detection API的脚本，以及我们之后自己写的脚本都会用到这些库，如果你不想每次运行前都敲这个命令的话，可以把这条命令加入到~/.bashrc中(需要将pwd展开为实际路径)

最后运行一下测试脚本来检测安装是否正确

#进入 tensorflow/models/research/
python object_detection/builders/model_builder_test.py

如果看到下面的输出，那么Object Detection API的安装就完成了。
enter image description here

下载数据集

数据集由图片和相应的标注文件组成：

wget http://www.robots.ox.ac.uk/~vgg/data/pets/data/images.tar.gz
wget http://www.robots.ox.ac.uk/~vgg/data/pets/data/annotations.tar.gz
tar -xvf annotations.tar.gz
tar -xvf images.tar.gz

完成以后目录应该看起来是这样的
enter image description here

images:
enter image description here
annotations:

在image目录就是一些宠物猫狗的照片，而在annotations文件夹里面是对相应照片的标注，在annotations文件夹中的和images文件夹中照片文件名一致的xml文件就是标注文件，这些标注文件为PASCAL VOC格式，我们可以打开Abyssinian_1.xml看一下

enter image description here

标注内容主要为图片的源信息，比如高和宽，物体的名称，以及所在位置：（xmin， ymin, xmax, ymax）所标识的矩形框。

还记得我们需要一个物体类别的数字编号和物体类别实际名称的对应关系的文件吗？我们可以在这里找到：

object_detection/data/pet_label_map.pbtxt

文件内容看起来是这样的：
enter image description here

注意：所有物体类别的数字编号都是从1开始的，因为0是一个在数学计算中很特殊的值。

生成TFRecord文件

Object Detection API的训练框架使用TFRecord格式的文件作为输入。所以这里需要将图片和标注转换为TFRecord格式的文件。

TFRecord数据文件是一种将图像数据和标签统一存储的二进制文件，能更好的利用内存，在tensorflow中快速的复制，移动，读取，存储等。

Demo里面包含了生成对应TFRecord格式文件的脚本，运行：

# 进入 tensorflow/models/research/
python object_detection/create_pet_tf_record.py \
--label_map_path=object_detection/data/pet_label_map.pbtxt \
--data_dir=DATA_DIR \
--output_dir=DATA_DIR

这里你需要将DATA_DIR替换为images和annotations所在的文件夹（父文件夹），不出意外的话，生成的文件应该看起像这样:
enter image description here

pet_train.record为训练集， pet_val.record为测试集。

准备转移学习

我们还需要一个Pre-trained模型来进行转移学习，因为我们想尽量的缩短学习的时间，在这里仍然选择上一节课中使用的ssd_mobilenet_v1_coco

下载以后解压备用：

enter image description here

在转移学习中要用的文件是model.ckpt.* 这三个文件。

准备配置文件

我们还需要一个配置文件来对训练的流程进行配置，比如使用什么算法，选用什么优化器等。在object_detection/samples/configs/可以找到很多配置模板，在这里使用object_detection/samples/configs/ssd_mobilenet_v1_pets.config作为起始的配置文件，我们需要在这个模板上面稍作修改。

这个配置文件是一个JSON格式的文件，里面有很多配置项，我们先挑一些必须修改的或者重要的项目：

train_input_reader: {
   tf_record_input_reader {
   input_path:   "PATH_OF_TRAIN_TFRECORD"
   }
   label_map_path: "PATH_OF_LABEL_MAP"
}

需要将PATH_OF_TRAIN_TFRECORD替换为pet_train.record的绝对路径，将PATH_OF_LABEL_MAP替换为pet_label_map.pbtxt的绝对路径;

eval_input_reader: {
  tf_record_input_reader {
    input_path: "PATH_OF_VAL_TFRECORD"
  }
  label_map_path: "PATH_OF_LABEL_MAP"
}

需要将PATH_OF_VAL_TFRECORD替换为pet_val.record的绝对路径，将PATH_OF_LABEL_MAP替换为pet_label_map.pbtxt的绝对路径;

train_config: {
  fine_tune_checkpoint: "CHECK_POINT_PATH"
  from_detection_checkpoint: true
  num_steps: 200000
}

如果将from_detection_checkpoint设为true的话，代表我们将从一个事先训练好的模型开始继续训练（转移学习），此时需要将CHECK_POINT_PATH替换为model.ckpt的绝对路径（注意之前有三个文件， model.ckpt.index, model.ckpt.meta, model.ckpt.data-xxx 在配置时不需要加model.ckpt 之后的后缀），如： fine_tune_checkpoint: "/root/ssd_mobilenet_v1_coco_11_06_2017/model.ckpt"

num_steps为训练迭代的步数，我们这里暂时不修改。

将改好以后的配置文件重命名为pipeline.config

开始训练

准备好训练数据和配置文件以后，我们就可以开始进行训练了。通常我们会把训练会用到的文件放到一起（训练目录），这里建议把训练目录设置为这样：
enter image description here

注意：需要按照这个目录结构修改pipeline.config中的相应项

然后执行训练脚本：

# 进入 tensorflow/models/research/
python object_detection/train.py \
    --logtostderr \
    --pipeline_config_path=${TRAIN_DIR}/model/pipeline.config} \
    --train_dir=${TRAIN_DIR}/model/train

TRAIN_DIR需要替换为训练目录的绝对路径。

如果不出意外的话，你会听到CPU的风扇声开始响起来，电脑变得有点卡，同时可以在终端上看到以下输出：
enter image description here