【论文阅读】Mean teachers are better role models

最新推荐文章于 2024-11-06 22:49:08 发布

原创

最新推荐文章于 2024-11-06 22:49:08 发布 · 937 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#半监督深度学习 #Mean Teacher #论文阅读

MeanTeacher是一种针对TemporalEnsembling的优化，用于半监督学习。它通过维护两个模型的平均权重而不是标签预测来提高效率和准确性。该方法减少了对大量标签的依赖，并能提升测试准确性。

1. 摘要

最近提出的Temporal Ensembling在几个半监督学习基准中取得了最先进的结果。它维护每个训练示例的标签预测的EMA，并惩罚与此目标不一致的预测。然而，由于目标每个 epoch 只改变一次，因此在学习大型数据集时，Temporal Ensembling变得笨拙。为了克服这个问题，我们提出了 Mean Teacher，这是一种平均模型权重而不是标签预测的方法。作为一个额外的好处，Mean Teacher 提高了测试的准确性，并且可以使用比 Temporal Ensembling 更少的标签进行训练。

2. 前置知识

在阅读完论文摘要的同时，同时也伴随着懵逼，原因无非是缺少了这个领域的前置知识。这个小节主要就是介绍我在理解论文过程中补充了解的前置知识。

2.1. Temporal Ensembling

我们可以先翻译成时间集成，摘要中的第一句是在致敬前辈的发现，所以这个是state of art提出的。想要具体了解这篇论文中的知识点，可以看完之前的博客。

2.2. EMA

EMA(exponential moving average)，也叫指数移动平均，是时间序列分析中常用到的一种类型平均值。简单来说，EMA就是一个加权平均值。其中，它的一个重要的特点是随着时间的流逝，旧的观察值会呈现指数衰减。等式1，表示的是EMA的递推公式，详情可以参见博客。

$S_t = \begin{cases} S_0,& t=1 \\ (1-\alpha)S_{t-1}+\alpha X_t,& t \geq2 \\ \$

最低0.47元/天解锁文章

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

来日可期1314 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。