《MixMatch: A Holistic Approach to Semi-Supervised Learning》论文阅读报告

FeSCN6

于 2024-05-18 17:46:17 发布

阅读量1.2k

点赞数 13

CC 4.0 BY-SA版权

文章标签：论文阅读 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/m0_62042674/article/details/139028870

1. 算法核心思想

1.1 基本思想

现有的半监督学习方法主要有三种：自洽正则化（Consistency Regularization），最小化熵（Entropy Minimization）和传统正则化（Traditional Regularization）。而MixUp同时兼具了这三种方法的优点：集成了自洽正则化，在图像数据增广中使用了对图像的随机左右翻转和剪切（crop）；使用“sharpening”函数，最小化未标记数据的熵；使用了单独的权重衰减并使用MixUp作为正则化器（应用于标记数据点）和半监督学习方法。

MixMatch的伪代码如下图所示（图一），接下来将按照步骤详细介绍MixMatch的每一个部分。

图一 MixMatch算法伪代码

1.2 关键步骤

1.2.1 数据增强

同时对有标记数据和无标记数据做增强。对一个Batch的有标记数据X和一个Batch的无标记数据U做数据增强，对X做一次增强且标签不变，而对U做K次。

1.2.2 标签猜测

将增强后的未标注数据输入预测模型，模型生成“猜测”标签。为一个Batch中的每一个未标记数据ub的K个增强的猜测标签计算平均值（伪代码第七行所示）：

使用Sharpen 算法对上式得到的标签进行处理，得到标签qb。Sharpen 算法具体操作如下：

其中，T为超参数，当T趋近于0时，Sharpen(p, T)i 接近于One-Hot 分布，即对某一类别输出概率1，其他所有类别输出概率0，此时分类熵最低。这很好理解，比如在猫狗二分类中，分类器说，这张图片中50%的几率是猫，50%的几率是狗，对各类别分类概率预测比较平均；而使用Sharpen来使得“伪”标签熵更低，即猫狗分类中，要么百分之九十多是猫，要么百分之九十多是狗。

图二标签猜测与Sharpen过程

从图中Average到Sharpen的变化也可以看出该操作的作用：使得“伪”标签熵更低，使输出接近于One-Hot 分布。

1.2.3 MixUp

将前两步得到的所有数据增强之后的带标签数据及它们的标签、所有未标注数据及其“猜测”标签整合成以下集合：

将和混合在一起，随机重排得到数据集。最终输出将与做了MixUp() 的一个 Batch 的标记数据

最低0.47元/天解锁文章

200万优质内容无限畅学

博客等级

码龄4年

12
原创

273
点赞

291
收藏

190
粉丝

关注

私信

热门文章

上一篇：: 词义消歧：调研与思考

下一篇：: Encoding Sentences with Graph Convolutional Networks for Semantic Role Labeling 论文阅读

最新评论

Encoding Sentences with Graph Convolutional Networks for Semantic Role Labeling 论文阅读
优快云-Ada助手: 你好，优快云开始提供 #论文阅读# 的列表服务了。请看：https://blog.youkuaiyun.com/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
《MixMatch: A Holistic Approach to Semi-Supervised Learning》论文阅读报告
优快云-Ada助手: 你好，优快云开始提供 #论文阅读# 的列表服务了。请看：https://blog.youkuaiyun.com/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
数据挖掘加利福尼亚房价预测
优快云-Ada助手: 尊敬的博主，恭喜您在数据挖掘领域取得了新的成就！加利福尼亚房价预测是一个非常具有挑战性的课题，您的博客内容必定会对很多读者有所启发。希望您能继续保持创作的热情和勇气，不断分享您的研究成果和心得体会。或许下一步您可以考虑深入分析不同地区的房价预测模型，或者探索其他与数据挖掘相关的主题，为大家带来更多新的启发和思考。期待您的下一篇精彩作品！优快云正在通过评论红包奖励优秀博客，请看红包流：https://bbs.youkuaiyun.com/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3

大家在看

最新文章

目录

展开全部

收起

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。