

半监督学习算法
第一种:无标签数据预训练,有标签数据微调
预先用所有数据逐层重构预训练,对网络的每一层进行重构自编码,得到参数后用有标签数据 微调(有标签数据是验证集来进行调整 )
重构自编码
自编码:是一种无监督学习模型,它令每个样本的数据是它本身,自编码相当于自己生成标签,而且标签是样本本身。
自编码器能从数据样本中进行无监督学习,这意味着可将这个算法应用到某个数据集中,来取得良好的性能,且不需要任何新的特征工程,只需要适当地训练数据。
第二种:利用从网络中得到的深度特征来做半监督算法
先用有标签数据训练得到一个网络模型,在让无标签数据送入网络中,以分类概率类别最高的作为数据的标签,然后再将无标签数据和有标签数据一起再网络模型中训练,如此循环,从而得到一个较好的模型。
但是再实际应用中,这种效果往往比较差,因为极易出现错误的标签,因为再前面训练中只有一部分有标签数据,所以容易产生过拟合问题,对无标签数据进行生成标签的时候,肯定会参杂着很多错误的标签,如果让错误的标签参与训练,那么就会学习到一些错误的参数。
第三种:让网络自身进行半监督学习
这一种用的比较多,接下来通过论文来讲解这中算法:
1、为什么半监督学习适用于医疗呢?

最低0.47元/天 解锁文章
1205

被折叠的 条评论
为什么被折叠?



