NeurIPS 2021 | 空间集成 ——一种新颖的模型平滑机制

本文介绍了一种名为空间集成(Spatial Ensemble,SE)的新型模型平滑技术,用于半监督和自监督学习,以改善模型的稳定性和性能。SE通过随机选取并更新网络子结构来实现平滑,与传统的时序平滑(如指数滑动平均)相结合,形成时空平滑(Spatial-Temporal Smoothing,STS)机制,提高了模型的收敛性和鲁棒性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

7ca1b0c14a25f2ae93592b2282306a04.png

本文内容已被 NeurlPS 2021 接收,感兴趣的同学可以直接点击文末的“阅读原文”查看详细内容。

c1add42615ba647670ab86f2bcdf5313.png

由于高昂的数据标注成本,无标签数据的利用获得了学术界和工业界越来越多的关注,涌现出不少优秀的半监督和自监督学习方法,例如 FixMatch, MoCo, BYOL 等,大幅缩小了半监督/自监督学习与全监督学习的性能差距。

其中,学生-老师框架+模型平滑技术已经成为半监督及自监督方法的一种流行范式。本文首先介绍了这种经典的范式,并从当前主流的基于时序的模型平滑机制出发,介绍了一种空间平滑方法——空间集成(Spatial Ensemble)

学生-老师框架

以经典的半监督框架 Mean Teacher 为例,该方法采用了一种学生-老师框架(student-teacher framework)

8b576ba4a85f41aedd2cacd14cf54f3a.png

图1 Mean Teacher 框架示意图

如图 1 所示,该框架包含一个学生网络(student)和一个老师网络(teacher)。Teacher 为无标签数据生成类别伪标签监督信号,以引导 student 的学习。

在这个过程中,student 基于常规的梯度反向传播来进行更新,而 teacher 则借助于模型平滑技术(Model Smoothing)来进行更新。

这种基于模型平滑技术的学生-老师框架后来广泛应用于多种优秀的自监督框架(如 MoCo、BYOL)中,如图 2 所示。

9142d23947edebb9533c08229a4f22bd.png

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值