一、DeepLab V1
1、结构:
DeepLab V1使用了卷积神经网络(CNN)与条件随机场(CRF)的组合来实现图像的语义分割,前面部分主要是跟vgg的结构差不多的。具体而言,它通过标准的卷积神经网络进行特征提取,然后在最后的DCNN层输出结果上结合一个全连接的CRF,增强分割边界的精细度。
2、优点:
- 边界精细度提升:CRF的加入显著提升了边界的精确度,使得分割结果在边界处更为清晰。
- 计算效率:通过引入“洞(Atrous)算法”,有效地减少了计算量,使得特征提取过程更加高效(DeeplabV1)。
3、缺点:
- 多尺度处理不足:V1主要依赖于单一的特征尺度,处理不同大小物体的能力有限。
- 对全局上下文缺乏处理:仅使用CRF和CNN组合,缺乏对全局上下文信息的进一步利用(DeeplabV1)。
二、DeepLab V2
1、结构: