Abstract
现代数据集的规模不断扩大, 加上获取标签信息的难度, 使得半监督学习成为现代数据分析中具有重要现实意义的问题之一。我们重新审视使用生成模型进行半监督学习的方法, 并开发新的模型, 以便有效地将小标签数据集推广到大型无标签数据集。迄今为止, 生成办法要么是不灵活的, 要么是效率低下的, 要么是不可扩展的。我们表明, 深入生成模型和近似贝叶斯推理利用最近的进展, 变分方法可以用来提供显著的改进, 使生成方法具有高度竞争力的半监督学习、
2 Deep Generative Models for Semi-supervised Learning
我们面临的数据显示为对 (x, y) = {(x1, y1),..... (x1, y1)}, 与 i-th 观察 rd 和相应的类标记 {1, l}。观测将有相应的潜在变量, 我们用 zi 来表示。只要很明显我们指的是与单个数据点关联的术语, 我们就会省略索引 i。在半监督分类中, 只有一部分观测值具有相应的类标签;我们指的是在标记和未标记的子集上的经验分布, 分别为 pel (x, y) 和 peu (x)。我们现在开发半监督学习模型, 利用数据的生成性描述来提高仅使用标记数据获得的分类性能
关于式子7怎么来的:

有关红框的说明:



这篇论文笔记探讨了在现代大规模数据集和有限标签信息环境下,半监督学习的重要性。通过开发新的深动生成模型,结合变分方法和近似贝叶斯推理,解决了传统生成方法的灵活性、效率和可扩展性问题。这些改进使生成模型在半监督学习任务中展现出竞争力,提升分类性能。
最低0.47元/天 解锁文章

被折叠的 条评论
为什么被折叠?



