深度学习中的数据增强方法之FMix

本文介绍了FMix,一种受MixUp和CutMix启发的数据增强技术,旨在改进样本融合方法。FMix利用傅里叶空间的低频图像二值模板,提供更灵活的融合形状,从而在保持语义信息的同时降低过拟合风险。实验表明,FMix在性能上超越了MixUp和CutMix。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

论文题目:FMix: Enhancing Mixed Sample Data Augmentation-2020
官方代码:FMix-Pytorch

一、摘要

近几年,样本融合的数据增强方法获得了越来越多的关注,比如一些很成功的变体-MixUp和CutMix。受到CutMix方法的启发,我们提出了FMix方法。FMix方法使用了从傅里叶空间中采样得到的低频图像的二值模板。FMix性能超过了MixUp和CutMix。

二、介绍

2.1 MixUp和CutMix方法的优缺点

MixUp在样本之间进行插值,而CutMix方法从一个随机选取的图像中选择一块矩形区域,将该区域插入到另一个图像中,得到最终的输出图像。MixUp抑制了模型学习特定特征的能力,包括更细致的特征。
我们认为,CutMix能够使得模型保持对真实数据的良好了解,因为观察的特征通常仅仅来源于一个数据点。同时CutMix通过动态增加可观察数据点的数量降低了模型的过拟合风险。然而,CutMix仅仅使用了一个固定的矩形区域,这就有了不必要的限制。

2.2 FMix方法

我们发现插值能造成过早的紧缩,使得模型更偏重于一般特征。而使用模板的融合能够保存语义信息分布,更适合分类任务中的增强。
基于上述的问题,提出了FMix方法。FMix使用了任意形状的模板(不单单是固定不变的一个矩形区域),同时保留了CutMix的性能。

三、方法

FMix方法流程如下:

  • 从beta分布中采样得到lambda值
  • 从傅里叶空间中获取低频图像
  • 利用低频图像获取二值图像mask
  • 随机选择两张图像Image1,Image2
  • 分别计算 x 1 x_1 x1 = Image2 X mask 和 x 2 x_2 x2 = Image1 X(1-mask)
  • 输出图像Image = x 1 x_1 x1 + x 2 x_2 x2

实现效果如下图所示:

四、代码实现

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值