DeepLab
1 介绍
相比于传统的视觉算法(SIFT或HOG),Deep-CNN以其end-to-end方式获得了很好的效果。这样的成功部分可以归功于Deep-CNN对图像转换的平移不变性(invariance),这根本是源于重复的池化和下采样组合层。平移不变性增强了对数据分层抽象的能力,但同时可能会阻碍低级(low-level)视觉任务,例如姿态估计、语义分割等,在这些任务中我们倾向于精确的定位而不是抽象的空间关系。
DeepLab是结合了深度卷积神经网络(DCNNs)和概率图模型(DenseCRFs)的方法。
1.1 背景

在实验中发现DCNNs做语义分割时精准度不够的问题,根本原因是DCNNs的高级特征的平移不变性(即高层次特征映射)。
1.2 Deeplab V1介绍
DeepLab是结合了深度卷积神经网络(DCNNs)和概率图模型(DenseCRFs)的方法。
与其他先进模型的主要区别在于DenseCRFs和DCNN的结合。是将每个像素视为CRF节点,利用远程依赖关系,并使用CRF推理直接优化DCNN的损失函数。拓展:Koltun(2011)的工作表明完全连接的CRF在语义分割下非常有效。


DeepLab模型通过结合深度卷积神经网络(DCNNs)和概率图模型(DenseCRFs),解决了语义分割的精度问题。其特点包括使用空洞卷积扩大感受野,保留更多空间信息,以及应用CRF进行精确的像素级定位。空洞卷积避免了池化导致的信息损失,而CRF则用于优化边缘细节。DeepLab系列在语义分割任务中表现出色,综合考虑了局部和全局信息。
最低0.47元/天 解锁文章
5368

被折叠的 条评论
为什么被折叠?



