浅入浅出TensorFlow 8 - 行人分割

最新推荐文章于 2024-10-08 20:24:28 发布

转载最新推荐文章于 2024-10-08 20:24:28 发布 · 469 阅读

人脸检测专栏收录该内容

34 篇文章

订阅专栏

一. 环境准备

本文介绍如何通过 Mask-RCNN 来实现行人检测，假设你已经对 SSD、YOLO、Faster RCNN 等框架有所了解。

1. 准备 TensorFlow 环境

Tensorflow (>= 1.0.0)

Numpy

2. Gtihub 代码

代码下载：【Github】

3. 下载CoCo数据

下载地址：http://mscoco.org/dataset/#download

Web下载比较慢，可以从我的网盘下载：【百度网盘】

4. 下载 ReNet50

[cpp] view plain copy

wget http://download.tensorflow.org/models/resnet_v1_50_2016_08_28.tar.gz

解压得到 resnet_v1_50.ckpt

二. 代码编译运行

代码编译可以参考 Github 说明，这里也给出如下流程：

1. make coco工具

[cpp] view plain copy

cd ./libs/datasets/pycocotools
make

2. 将下载的 COCO 数据放到 ./data 目录下，将数据转换成 tf 所需格式；

按照说明文件：

a）在 data下建一个 coco 文件夹，将指定的5个文件 copy到该目录；

b）将zip文件解压缩；

c）在根目录下建立 output/mask_rcnn 文件夹，用于存放 log；

d）执行格式转换脚本（大概会花一小时）；

[cpp] view plain copy

python download_and_convert_data.py

可能会提示Python某些库错误，没关系，安装一下就好了，可以将pip源换成国内的，pip install -i https://pypi.tuna.tsinghua.edu.cn/simple pil

[cpp] view plain copy

sudo pip install pil   # or python -m pip install Pillow
sudo pip install scikit-image
sudo apt-get install python3-tk

3. 提前训练好的 Resnet模型

在data下新建 pretrained_models 目录，将 resnet_v1_50.ckpt 放到目录下。

4. Make编译

[cpp] view plain copy

cd ./libs
make

5. 训练数据

[cpp] view plain copy

python ../train/train.py


当你观察到Loss的时候，说明训练过程已经成功开始了，不要着急，等着Loss慢慢减少吧，原作者训练 8-GPU 花了32个小时。