注:本篇算是半讲解半翻译吧,我真的觉得这篇论文写的很难理解.......可能是我水平不够,也可能作者省略了一些具体信息,主要是提供了他的idea吧。
但是DeepLab这个思路的确是不错,所以这个论文还是有必要看的。
1、导引
• Our system works directly on the pixel representation, similarly to FCN ,Long et al. (2014).
他们的系统和FCN十分相似,也是直接对像素进行预测。
• we believe it is advantageous that segmentation is only used at a later stage, avoiding the commitment to premature decisions.
他们坚信分割的步骤放在最后的阶段要好一些,以此避免一些前面不成熟的预测。
• The main difference between our model and other state-of-the-art models is the combination of pixel-level CRFs and DCNN-based ‘unary terms’.
他们的模型和其他的state-of-art的模型最大的区别就是他们把基于像素水平的CRFs和基于DCNN的一元表示 相结合。
• Our approach instead treats every pixel as a CRF node, exploits long-range dependencies, and uses CRF inference to directly optimize a DCNN-driven cost function.
我们的方法不是把每一个像素点为CRF节点,而是利用远程依赖关系,并使用CRF推理直接优化DCNN驱动的损失函数。
• We note that mean field had been extensively studied for traditional image segmentation/ edge detection tasks, but recently Koltun showed that the inference can be very efficient for fully connected CRF and particularly effective in the context of semantic segmentation
我们注意到,平均场已被广泛研究用于传统图像分割/边缘检测任务,但是最近Koltun表明,对于全连接的CRF,推理可以是非常有效的,并