KDforAA论文笔记

最新推荐文章于 2022-07-20 00:21:27 发布

原创

最新推荐文章于 2022-07-20 00:21:27 发布 · 312 阅读

0 ·

CC 4.0 BY-SA版权

本文介绍了KDforAA论文，即通过知识蒸馏来避免AutoAugment中的异常值问题。异常值可能导致图像关键信息丢失，形成噪声。论文提出在交叉熵损失基础上加入KL散度项，利用预训练模型作为教师模型生成软标签，从而减少噪声影响。实验结果显示，这种方法在Cifar-10、Cifar-100和ImageNet上提高了模型的准确性。

KDforAA，论文全称是Circumventing Outliers of AutoAugment with Knowledge Distillation，论文的大概意思就是使用蒸馏的方法规避掉AutoAugment中的一些异常值，何为异常值，后面会详细说到。这篇论文也在ImageNet上取得不错的成绩，将EfficientNet-B8网络的top-1提升到85.8%的高度。

论文先简单介绍了之前AutoML在数据增强中的应用。图1是论文中使用到的数据增强的transform搜索列表，沿用了AutoAugment的设置。Augment的搜索目的是在训练集中找一种最佳的增强策略，应用在验证集中。在搜索时，每次最多选择两种增强方式，选中的增强方式中再选择其增强的力度。搜索的方法有强化学习和权值共享等方式，最后会学习出一组transform的选中和力度的概率分布。

图1. Augment的transform列表
在这里插入图片描述