深度学习计算机视觉进阶:数据增强与模型训练
1. 深度学习计算机视觉实践概述
在深入学习深度学习用于计算机视觉的过程中,我们会接触到一系列高级的算法、概念和技巧。这些内容主要分为三个部分:
1. 提升分类准确率的方法 :包括应用迁移学习方法(如微调或把网络当作特征提取器)、集成方法(训练多个网络并组合结果)、正则化方法(如数据增强)以及使用更高级的优化算法(如 Adam、RMSprop 等)。我们需要找到应用这些方法的最佳途径,以最少的努力获得最大的收益。
2. 处理更大数据集和更复杂网络架构 :当数据集太大无法全部放入内存时,我们将使用 HDF5 来解决。同时,会探讨使用 AlexNet、GoogLeNet、ResNet 和更深版本的 VGGNet 等网络架构,并将其应用于更具挑战性的数据集和竞赛,如 Kaggle 的猫狗识别挑战和 cs231n Tiny ImageNet 挑战。
3. 图像分类之外的应用 :涵盖基本目标检测、深度梦境和神经风格、生成对抗网络(GANs)以及图像超分辨率等。这些技术将帮助我们从深度学习新手转变为真正的实践者。
2. 数据增强的概念与作用
正则化旨在减少模型的泛化误差,可能会以略微增加训练误差为代价。除了参数化的正则化形式,还有其他类型的正则化,如修改网络架构本身(例如 Dropout)和对输入网络的训练数据进行增强。
数据增强是一种正则化方法,它通过对训练样本进行随机抖动和扰动,在不改变类别标签的情况下生成新的训练样本,从而提高模型的泛化能力。在计算机视觉中,常见的简单几何变换包
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



