论文地址:V1,https://arxiv.org/abs/1704.04861;V2,https://arxiv.org/abs/1801.04381
模型实现:Caffe框架(非官方)https://github.com/shicai/MobileNet-Caffe
1、下载模型
https://github.com/shicai/MobileNet-Caffe
下载得到MobileNets的Caffe实现,其中分别包含V1、V2的模型结构文件.prototxt和训练好的模型文件.caffemodel,还有测试脚本eval_image.py。
2、模型测试
在下载得到的文件夹目录下执行以下命令:
python eval_image.py --proto mobilenet_deploy.prototxt --model mobilenet.caffemodel --image ./cat.jpg
输出如下:
对于V2模型使用以下命令:
python eval_image.py --proto mobilenet_v2_deploy.prototxt --model mobilenet_v2.caffemodel --image ./cat.jpg
3、使用自定数据集训练MobileNet(使用cifar-10)
(1)修改训练模型文件
保存deploy.prototxt 文件为mobilenet_train.prototxt,并修改。
1)删除前5行input/input_dim内容,增加Data层如下:
layer {
name: "cifar"
type: "Data"
top: "data"
top: "label"
include {
phase: TRAIN
}
transform_param {
mean_file: "/caffe/examples/cifar10/mean.binaryproto" //根据自己路径修改
}
data_param {
source: "/caffe/examples/cifar10/cifar10_train_lmdb" //根据自己路径修改
batch_size: 100
backend: LMDB
}
}
2)删除最后的prob层,增加Loss和Accuracy层:
layer {
name: "loss"
type: "SoftmaxWithLoss"
bottom: "fc7"
bottom: "label"
top: "loss"
}
layer {
name: "accuracy"
type: "Accuracy"
bottom: "fc7"
bottom: "label"
top: "accuracy"
include {
phase: TEST
}
}
3)修改最后输出层的通道数
因为cifar-10为10分类,修改为num_output: 10
4)修改BN的use_global_stats
训练时要把BN的use_global_stats改为false,它表示是否使用caffe内部的均值和方差,不然训练的时候会报nan或者模型不收敛,测试的时候改为true
(2)准备训练文件
在Caffe根目录下新建文件夹examples/mobilenets
将examples/cifar10
下的cifar10_quick_solver.prototxt、cifar10_quick_solver_lr1.prototxt、train_quick.sh
三个文件复制过来,并修改文件名为mobilenet,如下所示:
三个文件中对应文件名也做出相应修改:
(3)开始训练
Caffe根目录下执行:
./examples/mobilenets/train_mobilenet.sh