卷积神经网络概述
1. 训练与模型
训练过程完成后,我们会得到训练好的模型参数,这本质上就是我们所说的模型。不过,训练时使用的超参数并不属于模型的一部分,也就是说,无法从训练好的模型本身推断出训练该模型时所使用的超参数值。
2. 流行的 CNN 模型
多年来,研究人员开发了许多 CNN 模型,这些模型在层维度、总层数、层类型和层连接等方面具有不同的架构。以下是一些最流行的 CNN 模型概述:
|模型名称|提出时间|层数|参数数量|Top - 1 准确率|Top - 5 准确率|特点|
| ---- | ---- | ---- | ---- | ---- | ---- | ---- |
|AlexNet|2012 年|5 个 CONV 层 + 3 个 FC 层|6100 万|57.2%|80.3%|首个赢得 ImageNet 挑战赛的 CNN,为 CNN 的广泛应用铺平道路,CONV 层有 11×11、5×5 和 3×3 三种核(滤波器)尺寸|
|VGGNet(以 VGG - 16 为例)|2014 年|13 个 CONV 层 + 3 个 FC 层|1.38 亿|68.5%|88.7%|使用更多 CONV 层提取不同尺度特征,提高了准确率,但参数大幅增加,速度慢于 AlexNet;仅使用 3×3 滤波器尺寸,便于硬件加速|
|GoogleNet|2014 年|58 层(57 个 CONV 层 + 1 个 FC 层)|700 万|68.9%|89.0%|参数高效,包含专门的 Inception 模块,模块包含 1×1、3×3、5×5 可变长度滤波器的四个分支|
|SqueezeNet|2016 年|26 个 CONV 层
超级会员免费看
订阅专栏 解锁全文
170万+

被折叠的 条评论
为什么被折叠?



