卷积神经网络架构及其在工业4.0中的应用
1. 卷积神经网络架构介绍
1.1 YOLO系列
1.1.1 YOLO v2
YOLO v2移除了全连接层,使用锚框(anchoring boxes)代替边界框(bounding boxes)。输入图像被划分为13×13的单元格,每个单元格放置5个锚框。网络预测边界框的参数,如中心坐标、高度和宽度,然后校正现有框的位置。
1.1.2 YOLO v3
YOLO v3基于DarkNet,由106个卷积层组成。前53层在ImageNet数据集上训练网络,后53层进行检测。与之前的版本相比,其架构速度较慢,但在检测更小的集群对象和更多类别时更准确。YOLO v3通过在网络的不同点对三种不同大小的特征图应用1×1滤波器来检测对象,其结构如下表所示:
| Layer | Filters | Size | Output |
| — | — | — | — |
| Convolution | 32 | 3 × 3 | 256 × 256 |
| Convolution | 64 | 3 × 3/2 | 128 × 128 |
| Convolution | 32 | 1 × 1 | 128 × 128 |
| 1× Convolution | 64 | 3 × 3 | 128 × 128 |
| Residual | - | - | - |
| Convolution | 128 | 3 × 3/2 | 64 × 64 |
| Convolution | 64 | 1 × 1 | 64 × 64 |
| 2× Convolu
CNN架构及其工业4.0应用
超级会员免费看
订阅专栏 解锁全文

20

被折叠的 条评论
为什么被折叠?



