数据增强
文章平均质量分 89
00000cj
计算机视觉,论文阅读记录
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Random Erasing 原理与代码解析
本文提出了一种新的数据增强方法Random Erasing(随机擦除),用于训练CNN。该方法在训练过程中随机选择图像中的一个矩形区域,并将其像素用随机值擦除,从而生成具有不同遮挡级别的训练图像。这样做可以减少过拟合的风险,并使模型对遮挡具有鲁棒性。Random Erasing不需要额外的参数学习,易于实现,并且可以与大多数基于CNN的识别模型集成。尽管方法简单,但Random Erasing与常用的数据增强技术(如随机裁剪和翻转)互补,并且在图像分类、目标检测和行人再识别等任务中取得了一致的性能提升。原创 2024-04-23 21:53:59 · 1540 阅读 · 0 评论 -
RandAugment(NeurIPS 2020)论文速读
本文为了消除了上述两个障碍,提出了一种新的数据增强策略RandAugment,它显著减小了搜索空间,并可以直接在目标任务上训练而不需要一个单独的代理任务。此外它的正则化强度可以根据不同模型和数据集的大小进行定制,并可以在不同任务和数据集上统一使用。在CIFAR-10/100、SVHN、ImageNet数据集上,RandAugment相较于之前的所有自动增强方法,取得了匹配或更优的性能。原创 2024-02-24 23:30:52 · 1456 阅读 · 0 评论 -
AutoAugment(CVPR 2019)原理与代码解析
本文提出了AutoAugment,自动搜索改进的数据增强策略。实现中,作者设计了一个搜索空间,其中一个策略由多个子策略组成,对于每个mini-batch中的每张图片随机选择一个子策略。每个子策略包含两个算子,每个算子是一个图像处理函数如平移、旋转、剪切以及函数对应的概率和大小。然后通过搜索算法找到最佳策略,使得模型在目标数据集上达到最高的验证精度。原创 2024-02-22 23:52:39 · 3917 阅读 · 0 评论 -
Copy-Paste(CVPR 2021)原理与代码解析
本文针对实例分割提出了一种新的数据增强方法Copy-Paste,可以显著增强实例分割的精度。尽管scale jittering和random resizing等数据增强方法已经用于之前的实例分割模型中,但它们本质上是通用的方法,并不是专门为实例分割设计的。原创 2024-02-20 22:03:55 · 3047 阅读 · 3 评论 -
Sample Pairing(ICLR 2018)
本文提出了一种新的应用于图像分类的数据增强方法SamplePairing,这种简单的数据增强技术显著提高了所有测试的数据集的分类精度。此外当训练集中的样本数量非常少时,SamplePairing技术很大程度的提高了精度,因此该方法对于训练数据非常有限的任务更有价值,比如医学图像任务。原创 2024-02-20 19:45:48 · 607 阅读 · 0 评论 -
Mosaic数据增强
具体就是将4张样本拼接成一张图,具有以下优点:(1)丰富一张图上的信息(2)增强后一张图上包含四张图的信息,减少了对大batch_size的依赖(3)通常小目标的检测效果要比大目标差,将四张图放到 一张图中,相当于变相扩充了数据集中小目标的样本数量。mosaic data augmentation最早是在YOLO v4的文章中提出的,但其实在。下面是YOLOv4 paper中给出的一些mosaic增强的示例图。下面以mmdetection中的实现为例,介绍一下具体实现。原创 2022-11-20 18:02:18 · 4589 阅读 · 3 评论 -
CutMix原理与代码解读
其中\(M\in\left\{0,1\right\}^{W\timesH}\)是一个binarymask表明从两张图中裁剪的patch的位置,和mixup一样,\(lambda\)也是通过\(\beta(\alpha,\alpha)\)分布得到的,在文章中作者设置\(\alpha=1\),因此\(lambda\)是从均匀分布\((0,1)\)中采样的。即\(lambda\)确定了patch与原图的面积比,即A图cutout的面积越大,标签融合时A图的比例越小。cutmix的具体过程如下。.........原创 2022-08-10 19:07:58 · 6628 阅读 · 1 评论 -
数据增强Mixup原理与代码解读
中,对两张图片mixup后只是合并了两张图中的所有gtbox,并没有对类别标签进行mixup。其中\(x_{i},x_{j}\)是从训练集中随机挑选的两张图像,\(y_{i},y_{j}\)是对应的one-hot标签,通过先验知识特征向量的线性插值和对应目标的线性插值还是对应的关系,构造了新的样本\((\widetilde{x},\widetilde{y})\)。其中\(\lambda\)通过\(\beta(\alpha,\alpha)\)分布获得,\(\alpha\)是超参。.........原创 2022-08-03 20:22:56 · 7650 阅读 · 0 评论
分享