这篇论文不是用作模型压缩的,作者想的是让student超越teacher
其训练方式如下:
实验结果,student超越teacher了:
Knowledge Distillation(10)——Born Again Neural Networks
最新推荐文章于 2023-04-29 15:14:28 发布
这篇论文不是用作模型压缩的,作者想的是让student超越teacher
其训练方式如下:
实验结果,student超越teacher了: