卷积神经网络:模型、数据集与处理硬件全解析
1. 卷积神经网络基础
在训练过程完成后,我们会得到训练好的模型参数,这些参数本质上就是我们所说的模型。不过,训练过程中使用的超参数并不属于模型的一部分,也就是说,无法从训练好的模型本身推断出训练该模型时所使用的超参数值。
2. 流行的 CNN 模型
多年来,研究人员开发了许多 CNN 模型,这些模型在层维度、总层数、层类型和层连接等方面具有不同的架构。以下是一些最流行的 CNN 模型概述:
| 模型名称 | 提出时间 | 层数 | 参数数量 | 特点 | 准确率(ImageNet 数据集 top-1/top-5) |
| ---- | ---- | ---- | ---- | ---- | ---- |
| AlexNet | 2012 年 | 5 个 CONV 层 + 3 个 FC 层 | 6100 万 | 首个赢得 ImageNet 挑战赛的 CNN,使用 11×11、5×5 和 3×3 三种卷积核 | 57.2%/80.3% |
| VGGNet(以 VGG - 16 为例) | 2014 年 | 13 个 CONV 层 + 3 个 FC 层 | 1.38 亿 | 大量使用 3×3 卷积核,能提取更多特征,但参数多,速度慢 | 68.5%/88.7% |
| GoogleNet | 2014 年 | 57 个 CONV 层 + 1 个 FC 层 | 700 万 | 采用 Inception 模块,参数效率高 | 68.9%/89.0% |
| SqueezeNet | 2016 年 | 26 个 CONV 层 | 120 万 | 专为移动应用设计,参数少,有 Fir
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



