深度学习计算机视觉中的数据增强与实践
1. 深度学习进阶概述
在完成基础的深度学习知识学习后,接下来将迈向更高级的阶段,学习更多提升分类准确率的方法、处理更大数据集以及应用更复杂的网络架构,还会涉及图像分类之外的计算机视觉应用。
提升分类准确率的方法有很多,例如:
- 迁移学习 :包括微调模型或把网络当作特征提取器。
- 集成方法 :训练多个网络并整合结果。
- 正则化方法 :像数据增强这种方法能生成额外的训练数据,提升模型的泛化能力。
- 高级优化算法 :如Adam、RMSprop等,在部分数据集上可降低损失。
处理更大数据集时,会面临数据集无法全部放入内存的问题,同时会使用AlexNet、GoogLeNet、ResNet和更深版本的VGGNet等更高级的网络架构,并应用于Kaggle的猫狗识别挑战和cs231n Tiny ImageNet挑战等。
除了图像分类,还会涉及基本目标检测、深度梦境和神经风格、生成对抗网络(GANs)以及图像超分辨率等应用。
2. 数据增强的原理与方法
2.1 数据增强的定义与作用
数据增强是指通过对原始数据施加随机抖动和扰动,生成新的训练样本,且不改变样本的类别标签,目的是提高模型的泛化能力。
以正态分布的数据为例,若直接在完美的正态分布数据上训练模型,模型可能会精确拟合该分布,但在实际应用中,数据往往并非如此完美。为了增强分类器的泛化能力,可以对分布上
超级会员免费看
订阅专栏 解锁全文
7万+

被折叠的 条评论
为什么被折叠?



