基于拓扑交互与斯佩尔克对象推理的图像分割技术
在图像分割领域,传统方法往往依赖大量有监督数据,且多为特定类别训练,这使得它们在处理未训练对象类别和复杂配置时面临挑战。本文将介绍两种创新的图像分割方法,一种基于拓扑交互,另一种基于斯佩尔克对象推理,它们为解决这些问题提供了新的思路。
基于拓扑交互的图像分割
算法复杂度与内存需求
在图像分割中,提出的方法在计算复杂度上具有优势。其运行时间为$O(N^2 log N)$,其中$log N$源于卷积的快速傅里叶变换(FFT)实现。与朴素解法相比,朴素解法的运行时间与$k$呈二次关系,而该方法由于使用了FFT,运行时间与$k$无关。在实际应用中,深度学习框架对卷积操作进行了高度优化,使得该方法的计算成本比朴素解法低几个数量级。两种方法在存储映射$V$时的内存需求相似,均为$O(N^2)$。
融入端到端训练
为了将提出的拓扑交互模块融入端到端训练,引入了拓扑交互损失$L_{ti}$来纠正拓扑错误。具体定义如下:
设$f \in R^{c×H×W}$是网络预测的多类似然图,其中$c$、$H$和$W$分别表示类别数、图像高度和宽度;$g \in R^{H×W}$是具有离散标签$0, 1, …, c - 1$的真实分割图。使用$L_{pixel}$表示像素级损失函数,如交叉熵、均方误差或骰子损失。通过第3.1节得到的二进制掩码$V$,定义拓扑交互损失$L_{ti}$为:
$L_{ti} = L_{pixel}(f \odot V, g \odot V)$
最终的损失$L_{total}$由下式给出:
$L_{total} = L_{ce} + \lambda_{
超级会员免费看
订阅专栏 解锁全文
992

被折叠的 条评论
为什么被折叠?



