Multi-exit Network

今天刷leetcode了吗

已于 2022-03-03 11:27:20 修改

阅读量1k

点赞数

分类专栏：论文学习文章标签： python

于 2022-03-03 10:57:47 首次发布

本文链接：https://blog.youkuaiyun.com/qq_37435458/article/details/123248680

版权

关键词：Multi-exit，动态网络，Anytime prediction， budgeted batch classification
参考：https://blog.youkuaiyun.com/c9Yv2cf9I06K2A9E/article/details/120340325
NPL中的multi-exit调研 :https://github.com/txsun1997/awesome-early-exiting
在这里插入图片描述
【Improving the Accuracy of Early Exits in Multi-Exit Architectures via Curriculum Learning】2021-IJCNN
关键词：课程式学习
code(tf)：https://gitlab.au.dk/maleci/MultiExitCurriculumLearning
任务： image classification
数据集：CIFAR 10，CIFAR 100
训练方法：classifier-wise training, curriculum learning(创新点)
multi-exit常见训练方法：
（1）：end-to-end, one-stage, 联合训练所有branch的loss，每个branch的loss有一个超参数权重。问题：该方法对branch位置敏感，一个branch的acc可能受其他branch影响
（2）：layer-wise, 分级训练, n-stage，第一次训练模型直到第一个branch的部分，第二次冻结之前的权重，训练模型剩余部分直到第二个branch的部分，依次进行。
（3）：classifier-wise, n-stage, 首先训练backbone+final exit，然后冻结backbone，单独训练每个branch
本文选择classifier-wise是因为每个branch独立，因此其位置和数量也可以任意设置。而end-to-end、layer-wise方法对branch的位置和数量是敏感的。
curriculum learning见课程式学习 Curriclum Learning，主要包含一个sorting function设计和pacing function设计
常见的sorting function：
（1）：基于先验知识的度量
（2）：teacher网络的得分来衡量，再训练student网络。如果teacher和student采用同一个网络，则称为self-taught。
（3）：强化学习
文中采用第二种方法：two stage，用一个teacher network获得样本得分衡量样本难易度，按照得分顺序输入student network来训练。
文中指出一些情况下anti-curriculum效果更好，需要都尝试一下。
网络backbone：DenseNet201, MobileNet, ResNet152, InceptionV3
Exit branch设计：
（1）数量：2
（2）结构：见下图, 参考自“Triple wins: boosting accuracy, robustness and efficiency together by enabling input-adaptive inference”
（3）位置：文中对exit位置进行了讨论：
每个exit的位置取决于主干网的架构。
我们发现，在backbone中稍后面的放置一个exit并不一定会提高该分支的整体准确性，可能在更前的位置效果更好。
一般来说，exit位于“自然块”之后，例如concatenation layer，residual connection, dense block之后，它们的性能更好
（4）退出策略：branch输出的概率作为置信度
在这里插入图片描述