
Semi-Supervised Learning
张博208
知识搬运工
展开
-
MixMatch 论文解读
机器学习:MixMatch 论文解读_Matrix-11-优快云博客转载 2021-11-22 13:31:12 · 303 阅读 · 0 评论 -
Pseudo-Label
[论文阅读笔记22]Pseudo-Label:简单有效的半监督学习方法_ld326的专栏-优快云博客转载 2021-11-16 11:28:59 · 177 阅读 · 0 评论 -
PU learning
一、背景介绍现实生活许多例子只有正样本和大量未标记样本,这是因为获取负类样本较为困难、负类数据太过多样化且动态变化。比如在推荐系统,用户点击为正样本,却不能因为用户没有点击就认为它是负样本,因为可能样本的位置很偏,导致用户没有点击。PU Learning(Positive-unlabeled learning)是半监督学习的一个研究方向,指在只有正类和无标记数据的情况下,训练二分类器,伊利诺伊大学芝加哥分校(UIC)的刘兵(Bing Liu)教授和日本理化研究所的杉山将(Masashi Sugiya转载 2020-08-10 09:16:35 · 1763 阅读 · 0 评论 -
伪标签:教你玩转无标签数据的半监督学习方法
对于每个机器学习项目而言,数据是基础,是不可或缺的一部分。在本文中,作者将会展示一个名为伪标签的简单的半监督学习方法,它可以通过使用无标签数据来提高机器学习模型的性能。伪标签为了训练机器学习模型,在监督学习中,数据必须是有标签的。那这是否意味着无标签的数据对于诸如分类和回归之类的监督任务就无用了呢?当然不是! 除了使用额外数据进行数据分析,还可以将无标签数据和标签数据结合起来,一同训练半监...转载 2018-10-31 17:11:51 · 11123 阅读 · 5 评论 -
sklearn半监督学习
摘要:半监督学习很重要,为什么呢?因为人工标注数据成本太高,现在大家参加比赛的数据都是标注好的了,那么如果老板给你一份没有标注的数据,而且有几百万条,让你做个分类什么的,你怎么办?不可能等标注好数据再去训练模型吧,所以你得会半监督学习算法。不过我在这里先打击大家一下,用sklearn的包做不了大数据量的半监督学习,我用的数据量大概在15000条以上就要报MemoryError错误了,这个是我最...转载 2018-10-31 17:54:14 · 1599 阅读 · 0 评论 -
半监督学习——LabelSpreading
https://blog.youkuaiyun.com/weixin_39777626/article/details/79846823转载 2018-10-31 18:03:11 · 1296 阅读 · 0 评论 -
Multi-view Learning 多视角学习入门
https://blog.youkuaiyun.com/Danliwoo/article/details/79278574标准协同训练算法的步骤为:输入:标记数据集L,未标记数据集U。用L1训练视图X1上的分类器f1,用L2训练视图X2上的分类器f2; 用f1和f2分别对未标记数据U进行分类; 把f1对U的分类结果中,前k个最置信的数据(正例p个反例n个)及其分类结果加入L2;把f2对U的分类...转载 2018-10-31 18:29:23 · 3037 阅读 · 0 评论 -
半监督学习之self-training
https://blog.youkuaiyun.com/tyh70537/article/details/80244490转载 2018-10-31 18:55:40 · 3091 阅读 · 0 评论