解读RealMix:Towards Realistic Semi-Supervised Deep Learning Algorithms

来源:https://arxiv.org/pdf/1912.08766.pdf

官方代码:https://github.com/uizard-technologies/realmix

主要贡献:

1.在cifar10数据集上仅仅只利用每类250个标签数据实现了sota(error rate:9.79%) 

2.在标签数据和无标签数据完全 mismatch的情况下,依然能够surpass baseline performance。

3.论证了realmix 能够surpass迁移学习,并且迁移学习对半监督学习有一个很好的补偿作用。

算法过程:(这篇文章相当于集成了uda+mixmatch中的一些trick)

GenerateTarget部分:

由于没有提供具体的参考引用内容,以下是一些基于一般性知识对《Towards Cost - Effective Learning: A Synergy of Semi - Supervised and Active Learning》可能涉及内容的推测。 该研究可能聚焦于如何将半监督学习和主动学习相结合以实现更具成本效益的学习方式。半监督学习利用大量未标记数据和少量标记数据进行学习,而主动学习则通过主动选择最有价值的数据进行标记来提高学习效率。二者结合可能在减少标记数据成本的同时,提升模型的性能和泛化能力。 在实际应用中,这种结合可能会用于图像识别、自然语言处理等领域,以在有限的资源下取得更好的学习效果。例如,在图像识别任务中,主动选择一些具有代表性的图像进行标记,然后结合大量未标记图像进行半监督学习,从而在不标记大量图像的情况下获得高精度的识别模型。 ```python # 这里简单模拟一个可能的主动学习和半监督学习结合的伪代码框架 # 假设我们有一些未标记数据和少量标记数据 unlabeled_data = [...] labeled_data = [...] # 主动学习选择最有价值的数据进行标记 def active_selection(unlabeled_data, model): # 选择最有价值的数据的逻辑 selected_data = ... return selected_data # 半监督学习更新模型 def semi_supervised_learning(model, labeled_data, unlabeled_data): # 半监督学习的训练逻辑 updated_model = ... return updated_model # 循环进行主动学习和半监督学习 model = ... for i in range(num_iterations): selected_data = active_selection(unlabeled_data, model) # 标记选择的数据 labeled_data.extend(selected_data) model = semi_supervised_learning(model, labeled_data, unlabeled_data) ```
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值