自监督学习,相当于高效的预训练encoder。
做法:随机mask一定百分比的patch,将未mask的patch作为输入,经过encoder-decoder,在decoder时重建输出重建图片,MSE loss只计算mask部分的patch。decoeder不重要,我们需要的是已经自学习特征的encoder
自监督学习通过随机mask图像patch,使用未mask部分进行预训练,encoder处理后由decoder重建被mask的区域,MSEloss专注于评估mask部分的重建质量。重点在于encoder的学习特征,而非decoder的重建能力。
自监督学习,相当于高效的预训练encoder。
做法:随机mask一定百分比的patch,将未mask的patch作为输入,经过encoder-decoder,在decoder时重建输出重建图片,MSE loss只计算mask部分的patch。decoeder不重要,我们需要的是已经自学习特征的encoder
8070
898