系列博客目录 文章目录 系列博客目录 具体过程 示例 学习效果 “预测两个随机图像块之间的相对位置”是视觉自监督学习中的一种策略,旨在通过理解图像内部的空间关系来学习有效的图像特征表示。这种方法的背后原理是让模型学习图像结构的上下文信息,即每个图像块之间的相对空间位置关系。 具体过程 图像分块:将原始图像分割成若干个小块(如 3 × 3 3 \times 3 3×3 或 5 × 5 5 \times 5 5