DSRG [CVPR18]

最新推荐文章于 2024-05-26 10:04:41 发布

原创最新推荐文章于 2024-05-26 10:04:41 发布 · 1.3k 阅读

5 ·

CC 4.0 BY-SA版权

文章标签：

#weakly supervised #semantic segmentation

CV 专栏收录该内容

8 篇文章

订阅专栏

DSRG网络结合CAM和深籽区域增长算法，利用种子区域进行图像语义分割，通过逐步迭代扩展未知区域，优化分割效果。该方法在CVPR 2018发表，相较于SEC框架，DSRG在平衡前景背景损失、迭代种子扩展方面进行了改进。

DSRG

paper: Weakly-Supervised Semantic Segmentation Network with Deep Seeded Region Growing

文章被18年的CVPR收录，文章的出发点是：CAM能够提供物体最具辨识度的区域，但是对于物体辨识度较低的区域没有识别出来，所以如何正确划分这些待定区域是主要要解决的问题。
作者考虑将CAM的结果作为初始种子，之后不断生长，为附近的待定的区域打上标签，以使得整张图像每个点都有确定的类别划分。

generate seed area S

使用CAM获得图像 $I$ 的高置信度的前景区域 $R_C$ ，在使用基于saliency的传统算法得到背景的高置信度区域 $R_0$ 。
将 $R=R_C+R_0$ 作为种子，这些区域大概了占到了整张图像的40%，所以剩下60%的待定区域就需要通过种子生长确定类别。将R作为初始种子区域 $S$ 。

train network

在这里插入图片描述
图中S表示由CAM获得的类别识别区域。主干网络接受RGB图像 $I$ ，输出对应 $(N + 1)$ 个类别的 $(N + 1)$ 张feacher maps/score maps/heat maps/attention maps，分别记作 $H_{c’}，(c=0,1,2,...,N)$ 。

将 $(n + 1)$ 张feature maps 融合成最后的一张分割图记作 $H$ 。 $H_{u,c}$ 表示在 $H$ 的像素 $u$ 被判定为类别 $c$ 的置信度。
$Hu,c=arg⁡max⁡Hu,c′H_{u,c}=\arg \max H_{u,c'}$
DSRG模块接受 $H$ 和 $S$ 作为输入，从种子区域 $S$ 开始，依照 $H$ 的信息进行扩展，扩展规则如下：
- 对于位置 $u$ 被识别为类别 $c$ 的种子区域记作 $S_{u,c}$ ，遍历 $S_c$ 临近的(8个邻接位置)中的还没被标识类别的待定位置记作 $Su′S_{u'}$ 。
- 如果 $H_{u’}$ 也是被判定为类别 $c$ ，且 $Hu′,cH_{u',c}$ 的置信度高于阈值 $θ\theta$ ，则将点 $u^{'}$ 标识为类别 $c$ ，更新 $Sc=Sc∪u′S_c=S_c\cup u'$ 。
- 结束所有的类别 $c$ 的扩展后，会有很多待定区域被打上类别标识。尽管可能还有些区域还是待定。但是不管，在后续迭代中可能会被标识。
扩展之后我们得到了更新后的分割图 $G$ ，对应之前的 $S$ 有了更多的标识区域。
$G$ 中现在有确定类别的点和待定的点，确定类别的点的置信度都设为1。将 $G$ 作为label计算和 $H$ 的交叉熵作为seed loss，注意计算交叉熵时只看确定标识的点。下式中 $C$ 为前景类别， $C‾\overline{C}$ 表示背景。
$=−1∑c∈C∣Sc∣∑c∈C∑u∈Sclog⁡Hu,c−1∑c∈C‾∣Sc∣∑c∈C‾∑u∈Sclog⁡Hu,c\begin{aligned} \ell_{\text { seed }}=&-\frac{1}{\sum_{c \in \mathcal{C}}\left|S_{c}\right|} \sum_{c \in \mathcal{C}} \sum_{u \in S_{c}} \log H_{u, c}-\frac{1}{\sum_{c \in \overline{\mathcal{C}}}\left|S_{c}\right|} \sum_{c \in \overline{\mathcal{C}}} \sum_{u \in S_{c}} \log H_{u , c} \end{aligned}$
为了获得更好的边界信息，所以作者在下面加了个CRF模块输入 $H$ ，得到refined $H$ ，用于生成损失函数 $l_{boundary}$ 。作者没有详细说明，但估计使用细节与SEC中的 $l_{constrain}$ 相同。
最终的loss即：
$ℓ=ℓseed+ℓboundary\ell=\ell_{\text {seed}}+\ell_{\text {boundary}}$

compare to SEC

可以看到本文的框架和SEC有很大的相似之处。都包含了种子的损失 $l_{seed}$ 和边界损失 $l_{boundary}$ / $l_{constrain}$ 。
相同点：

种子的初始区域都是由CAM提供。
边界损失函数都是基于CRF。

不同点：

虽然两者的前景种子区域都是由CAM提供，但是获得背景种子区域使用的方法不同。
本文DSRG中的种子的损失函数 $l_{seed}$ 是考虑了前景和背景的balance，而在SEC中没有考虑。实验表明balance带来了1.1%的优化。
为了获得扩展区域SEC是引入了 $l_{expand}$ 刺激DCNN生成更大的区域，而本文DSRG是通过逐步迭代种子扩展，生成优化的label，更新 $S$ 区域从而影响 $l_{seed}$ 刺激DCNN生成更大的区域。