深度学习中的数据增强方法之FMix

沐风大大

于 2020-12-15 19:22:45 发布

阅读量3.7k

点赞数 2

分类专栏：深度学习文章标签：深度学习计算机视觉人工智能 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_42621901/article/details/111185217

版权

本文介绍了FMix，一种受MixUp和CutMix启发的数据增强技术，旨在改进样本融合方法。FMix利用傅里叶空间的低频图像二值模板，提供更灵活的融合形状，从而在保持语义信息的同时降低过拟合风险。实验表明，FMix在性能上超越了MixUp和CutMix。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

论文题目：FMix: Enhancing Mixed Sample Data Augmentation-2020
官方代码：FMix-Pytorch

数据增强方法之FMix

一、摘要
二、介绍
- 2.1 MixUp和CutMix方法的优缺点
- 2.2 FMix方法
三、方法
四、代码实现
五、实验结果

一、摘要

近几年，样本融合的数据增强方法获得了越来越多的关注，比如一些很成功的变体-MixUp和CutMix。受到CutMix方法的启发，我们提出了FMix方法。FMix方法使用了从傅里叶空间中采样得到的低频图像的二值模板。FMix性能超过了MixUp和CutMix。

二、介绍

2.1 MixUp和CutMix方法的优缺点

MixUp在样本之间进行插值，而CutMix方法从一个随机选取的图像中选择一块矩形区域，将该区域插入到另一个图像中，得到最终的输出图像。MixUp抑制了模型学习特定特征的能力，包括更细致的特征。
我们认为，CutMix能够使得模型保持对真实数据的良好了解，因为观察的特征通常仅仅来源于一个数据点。同时CutMix通过动态增加可观察数据点的数量降低了模型的过拟合风险。然而，CutMix仅仅使用了一个固定的矩形区域，这就有了不必要的限制。

2.2 FMix方法

我们发现插值能造成过早的紧缩，使得模型更偏重于一般特征。而使用模板的融合能够保存语义信息分布，更适合分类任务中的增强。
基于上述的问题，提出了FMix方法。FMix使用了任意形状的模板（不单单是固定不变的一个矩形区域），同时保留了CutMix的性能。

三、方法

FMix方法流程如下：

从beta分布中采样得到lambda值
从傅里叶空间中获取低频图像
利用低频图像获取二值图像mask
随机选择两张图像Image1,Image2
分别计算 $x_1$ = Image2 X mask 和 $x_2$ = Image1 X（1-mask）
输出图像Image = $x_1$ + $x_2$

实现效果如下图所示：

四、代码实现

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。