低功耗计算机视觉中的网络优化与流水线技术
1. 输入尺寸与批量大小对YOLOv2的影响
输入尺寸和批量大小是影响目标检测网络性能的重要因素。对于YOLOv2,不同的输入尺寸和批量大小组合会产生不同的平均精度均值(mAP)和每秒帧数(FPS)。具体数据如下表所示:
| 输入尺寸 | 批量大小 | mAP | FPS |
| — | — | — | — |
| 416x416 | 1 | 50.4 | 13.3 |
| 416x416 | 4 | 46.5 | 23.1 |
| 416x416 | 8 | 42.2 | 25.6 |
| 416x416 | 16 | - | 25.9 |
| 320x320 | 1 | - | 17.9 |
| 320x320 | 4 | - | 34.2 |
| 320x320 | 8 | - | 37.5 |
| 320x320 | 16 | - | 38.3 |
| 256x256 | 1 | - | 43.8 |
| 256x256 | 4 | - | 50.1 |
| 256x256 | 8 | - | 51.7 |
| 256x256 | 16 | 42.2 | 50.4 |
从表中可以看出,减小输入尺寸会使一个网格代表图像的更大部分,从而降低对小物体的检测精度,但与其他网络相比,精度下降较为平缓。而批量处理可以同时处理多个图像,提高处理元素的利用率,但可能不适用于实时目标检测。通过将输入尺寸减小到256×256并将批量大小增加到16,我们可以获得3.9倍的FPS提升,但会牺牲16.3%的mAP(从50.4降至42.2)
超级会员免费看
订阅专栏 解锁全文
4686

被折叠的 条评论
为什么被折叠?



