一、数据基石:ImageNet如何点燃预训练火种 (一)数据集的代际革命 维度 传统数据集(2000-2010) ImageNet(2012) 现代数据集(2023) 样本规模 千级(如Caltech101) 1400万标注图像 百亿级(如Laion-5B) 类别覆盖 数十类(如车辆、人脸) 2.2万语义类别 跨模态(图文音视频) 标注体系 平面标签 WordNet层级结构 多模态对齐标注 硬件需求 CPU单机处理 2块GPU起步 数千GPU集群训练 关键突破:语义结构化标注