半监督学习要定好整个框架:
- 把无标签数据读进来成为一个数据集
- 在无标签数据集中取1批数据X经过模型,得到预测值pred,pred有两个值,1个是置信度也就是概率(通常使用softmax),还有一个是标签a
- 若置信度>0.99,就把X和标签a一块加入新的数据集,叫做semi_dataset,在这个数据集中专门存放无标签数据中的那些被打上标签的数据(即超过置信度的哪些数据)
- 这样这些数据就可以当作训练集去训练了,把所有都看过一遍后,这个数据集就组建完成了,就可以拿去当有标签数据集进行训练了。
半监督学习要定好整个框架: