全文概括
本文的基本网络框架是YOLO,但用两层 conv 代替 两层 fc 。然后用 8-bit 量化了训练好的网络权重。
Introduction
8-bit 量化回归任务,会比量化分类任务更容易造成精度下降。
经过试验显示,本文方法(量化后)的最高检测率比量化前的只低不到 1 2%1~2\%1 2%,但在帧率上达到了 202020x 倍的提升。
YOLO使用的基础框架是 GoogleNet,即使将框架系统变成 AlexNet,其在嵌入设备上最多也只能每秒跑555帧。
Methods
Network Architecture
和YOLO相比,YOLO在除了最后一层,激活函数都选择 LeakyReLU ,而本文选择 ReLU。YOLO在最后一层不使用激活函数,而本文对不同的任务选择不同激活函数,分类(softmax),置信度(sigmoid),定位(不使用激活函数)。
训练过程和YOLO一样,损失函数也一直,除了 λnoobj=1\lambda_{noobj}=1λnoobj=1,而YOLO的该参数为0.50.50.5。
Quantized Network
作者认为量化回归任务比分类任务难的原因:
The justification for the high accuracy in low-precision modes comes from the fact that the final activation is a probability i.e. in [0,1] intervals, can be represented with an unsigned number without any concern on scaling.