《图解深度学习》学习笔记（五）

最新推荐文章于 2025-10-31 09:07:13 发布

原创

最新推荐文章于 2025-10-31 09:07:13 发布 · 1k 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#机器学习 #神经网络 #深度学习

本文探讨了提高深度学习模型泛化能力的方法，包括数据增强如ImageNet和Places数据集的应用，预处理技术如均值减法、均一化和白化的细节，以及各种激活函数如ReLU和maxout的比较。此外，介绍了防止过拟合的Dropout和DropConnect技术，总结了提升深度学习模型泛化能力的关键步骤。

第六章提高泛化能力的方法

前情回顾：

训练样本必不可少；
预处理后的数据更容易训练；
改进后的激活函数和训练方法有助于提高神经网络的泛化能力。

本章将详细介绍这些方法。

一、训练样本

数据增强(data augmentation)

1、ImageNet数据集

ImageNet数据集中的类别按照层级结构分布：参照了自然语言处理领域的层级结构词典WordNet。每个大类下面又细分好多小类。不同类别下的样本图像的外观和形状也多种多样，拍摄环境、拍摄角度以及形状也存在差异。其卓越之处在于为图像添加了类别注释信息，同时添加了物体的位置信息(矩形框)，所以其不仅可以用于物体识别，还可以作为物体检测的数据集来使用。

ImageNet大规模视觉识别挑战赛(ImageNet Large Scale Visual Recognition Callenge, ILSVRC)使用的就是ImageNet数据集。ILSVRC使用了ImageNet的一部分数据，包含1000个类别，每个类别选取了约1000张图像，总计有120万张训练图像。使用这些样本训练后的卷积神经网络具有较高的泛化能力，所以也有人提出把该网络参数作为神经网络的初始值进行网络训练。（预训练模型。）