Data Augmentation 策略
数据增强是提高模型性能和泛化能力的重要方法.
- 随机调整 - Random resize
- 平移 - Shift
- 水平/垂直翻转 - Horizontal/Vertical flip
- Rotation/Reflection 旋转/仿射变换
Noise - 高斯噪声,模糊处理
颜色增强 - Color Augmentation,包括色彩饱和度、亮度和对比度等.
PCA Jittering
首先,按照 RGB 三个颜色通道计算均值和方差,规范网络输入数据;
然后,计算整个训练数据集的协方差矩阵,进行特征分解,得到特征向量和特征值,以作 PCA Jittering.
随机图像插值 - Random Image Interpolation,主要是在图像裁剪和缩放时采用.
裁剪采样 - Crop Sampling,从原始图像中缩放裁剪,得到网络输入. 常用有两种方式:
Scale Jittering,如 VGG 和 ResNet;
尺度和长宽比增强变换 - Scale and aspect ratio augmentation,如 Google Inception 网络; 其缺点:随机选择 crop center 时,可能出现选择的区域不包含目标物体的区域.
监督数据增强 - Supervised Data Augmentation(SDA) (海康威视2016提出)