81、基于拓扑交互与斯佩尔克对象推理的图像分割技术

最新推荐文章于 2025-10-17 09:19:09 发布

c7d8e9

最新推荐文章于 2025-10-17 09:19:09 发布

阅读量45

点赞数

CC 4.0 BY-SA版权

分类专栏： ECCV 2022：计算机视觉的前沿探索文章标签：图像分割拓扑交互斯佩尔克对象推理

本文链接：https://blog.youkuaiyun.com/c7d8e9/article/details/150604588

ECCV 2022：计算机视觉的前沿探索专栏收录该内容

85 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

基于拓扑交互与斯佩尔克对象推理的图像分割技术

在图像分割领域，传统方法往往依赖大量有监督数据，且多为特定类别训练，这使得它们在处理未训练对象类别和复杂配置时面临挑战。本文将介绍两种创新的图像分割方法，一种基于拓扑交互，另一种基于斯佩尔克对象推理，它们为解决这些问题提供了新的思路。

基于拓扑交互的图像分割

算法复杂度与内存需求

在图像分割中，提出的方法在计算复杂度上具有优势。其运行时间为$O(N^2 log N)$，其中$log N$源于卷积的快速傅里叶变换（FFT）实现。与朴素解法相比，朴素解法的运行时间与$k$呈二次关系，而该方法由于使用了FFT，运行时间与$k$无关。在实际应用中，深度学习框架对卷积操作进行了高度优化，使得该方法的计算成本比朴素解法低几个数量级。两种方法在存储映射$V$时的内存需求相似，均为$O(N^2)$。

融入端到端训练

为了将提出的拓扑交互模块融入端到端训练，引入了拓扑交互损失$L_{ti}$来纠正拓扑错误。具体定义如下：
设$f \in R^{c×H×W}$是网络预测的多类似然图，其中$c$、$H$和$W$分别表示类别数、图像高度和宽度；$g \in R^{H×W}$是具有离散标签$0, 1, …, c - 1$的真实分割图。使用$L_{pixel}$表示像素级损失函数，如交叉熵、均方误差或骰子损失。通过第3.1节得到的二进制掩码$V$，定义拓扑交互损失$L_{ti}$为：
$L_{ti} = L_{pixel}(f \odot V, g \odot V)$
最终的损失$L_{total}$由下式给出：
$L_{total} = L_{ce} + \lambda_{

会员秒杀 ¥9.9 重磅福利

超级会员免费看