这篇论文提出了一种新的半监督文本分类的训练方法:核心思想是不仅要考虑伪标签表示的最大分量对应的索引(此即argmax),还要考虑标签角度方差。
标签角度(label angle)指文本的模型表示和标签向量之间的角度。
标签角度方差(label angle variances)指的是在同一标签内,标签角度的方差。
实现表明,对于半监督训练来说,标签角度方差的均值远大于监督训练:
该方法考虑了标签角度方差,在多个数据集中取得SOTA效果。
这篇论文提出了一种新的半监督文本分类的训练方法:核心思想是不仅要考虑伪标签表示的最大分量对应的索引(此即argmax),还要考虑标签角度方差。
标签角度(label angle)指文本的模型表示和标签向量之间的角度。
标签角度方差(label angle variances)指的是在同一标签内,标签角度的方差。
实现表明,对于半监督训练来说,标签角度方差的均值远大于监督训练:
该方法考虑了标签角度方差,在多个数据集中取得SOTA效果。