图像分割就像给照片中的每个像素颁发身份证——这张身份证上清清楚楚写着"你是天空"“你是汽车”“你是人行道”。当我们教会计算机完成这个任务时,就相当于赋予它理解世界的视觉能力。今天要讲的三个主角:FCN、U-Net和DeepLabv3+,正是这项技术发展历程中的三座里程碑。它们的故事就像一部跌宕起伏的科技大片,充满了天才的灵光乍现和工程师的执着探索。
一、破冰者FCN:掀开全卷积革命的序幕
1.1 前FCN时代的黑暗森林
在2015年之前,图像分割领域就像被迷雾笼罩的森林。传统方法依赖手工设计的特征提取器,工程师们绞尽脑汁设计各种边缘检测算子、区域生长算法,效果却总像雾里看花。更致命的是,这些方法就像刻板的教条主义者,换个场景就手足无措——检测道路的算法拿去分割医疗影像,结果必然惨不忍睹。
1.2 FCN的惊天一剑
加州大学伯克利分校的Long等人挥出破局之剑:全卷积网络(Fully Convolutional Network)。这个划时代的创举做了两件颠覆性的事情:
-
彻