开放集域适应文献阅读四_attract or distract: exploit the margin of op-优快云博客

Attract or Distract: Exploit the Margin of Open Set

1 问题与挑战
2 本文贡献
3 方法
4 小结
参考文献

1 问题与挑战

开集域适应，旨在在没有目标域标签的情况下同时处理域移动和未知对象的识别。目标域存在未知类，未知样本的存在阻碍了跨域的对齐，同时，跨域的类间不对齐也使得区分未知样本变得更加困难。

2 本文贡献

提出使用 semantic categorical alignment (SCA 语义类别对齐)来实现目标已知类的良好可分性。
并使用 semantic contrastive mapping (SCM 语义对比映射）来将未知类推离决策边界。

本文方法致力于通过增强表示的区分性，将目标域中的相似样本与源域对齐，同时将未知样本推离所有已知类来解决开放集域自适应问题。
图示如下
在这里插入图片描述

3 方法

3.1 总体架构

设计以下模块：
1）对抗性领域适应（ADA）。基于交叉熵损失，ADA 旨在最初将目标中的样本与源已知样本对齐，或将其分类为未知样本。
2）语义类别对齐（SCA）。本模块由两部分组成。首先，基于对比中心损失，旨在压缩来自同一类的样本的表示。第二，基于跨域的中心损失，尝试调整源和目标之间同一类的分布。
3）语义对比映射（SCM）。在对比损失的情况下，SCM 旨在鼓励目标中的已知样本向源中相应的质心移动。同时，它还试图使未知样本远离所有已知类。
总体框架如图2所示
在这里插入图片描述

3.2 对抗域适应（ADA）

这部分和 OSBP 一样。
符号表示：Source domain $\left\{X_s,Y_s\right\}$ ，Target domain $\left\{X_t\right\}$ .
我们利用对抗性训练方法，将目标中的样本与源域已知样本进行初始对齐，或将其作为未知样本拒绝。具体地，鉴别器 D 被训练以分离源域和目标域。然而，特征生成器 G 试图最小化源和目标之间的差异。当专家 D 无法确定样本来自哪个域时，G学习域不变表示。
将交叉熵损失与softmax函数一起用于已知源样本分类：
$\begin{aligned} \mathcal{L}_{c l s}\left(x_s, y_s\right) &=-\log \left(p\left(y=y_s \mid \boldsymbol{x}_s\right)\right) \\ &\left.=-\log \left(D \circ G\left(\boldsymbol{x}_s\right)\right)_{y_s}\right) \end{aligned}$
为了尝试为未知样本创建边界，我们利用了二进制交叉熵损失：
$\begin{aligned} \mathcal{L}_{a d v}\left(\boldsymbol{x}_t\right)=&-\frac{1}{2} \log \left(p\left(y=N+1 \mid \boldsymbol{x}_t\right)\right) \\ &-\frac{1}{2} \log \left(1-p\left(y=N+1 \mid \boldsymbol{x}_t\right)\right) \end{aligned}$
ADA模块的目标可以表述为：
$\begin{aligned} \mathcal{L}_{A D A}=& \min _G\left(\mathcal{L}_{c l s}\left(\boldsymbol{x}_s, y_s\right)-\mathcal{L}_{a d v}\left(\boldsymbol{x}_t\right)\right)+\\ & \min _D\left(\mathcal{L}_{c l s}\left(\boldsymbol{x}_s, y_s\right)+\mathcal{L}_{a d v}\left(\boldsymbol{x}_t\right)\right) \end{aligned}$
ADA 模块最初只将目标域中的样本与源已知样本对齐，并学习已知和未知之间的粗略边界。

3.3 语义类别对齐（SCA）

引入语义类别对齐（SCA），旨在压缩已知类的表示，并将每个已知类与其他类区分开来。SCA有两个步骤。首先，采用对比中心损失来增强源样本的一般特征的辨别性。其次，来自目标的已知类的每个质心将与源域中相应的类质心对齐。通过这种方式，源样本的表示将最终变得更具辨别力，同时，已知的目标质心将更精确地对齐。
1）为了压缩特征空间中属于同一类的源样本，将以下对比中心损失应用于源样本：
$\mathcal{L}_{c c t}=\frac{1}{2} \sum_{i=1}^m \frac{\left\|x_s^i-c_s^{y_s^i}\right\|_2^2}{\left(\sum_{j=1, j \neq y_s^i}^N\left\|x_s^i-c_s^j\right\|_2^2\right)+\delta}$
其中， $m$ 表示训练过程中小批量中的样本数量， $x_s^i$ 表示来自源域的第 $i$ 个训练样本。 $c_s^{y_s^i}$ 表示源域中 $y_s^i$ 类的质心。 $\delta$ 是用于预放空零分母的常数。
2）来自目标的已知类的每个中心将与源域中相应的类的中心对齐。
由于每个小 batch 有随机性、偏移性，所以使用全局中心来代替局部中心，而全局中心又是从每次局部中心的迭代中更新生成的。
全局中心的初始化：
$c_{(0)}^k=\frac{1}{n^k} \sum_{j=0}^{n^k} G\left(x_i^k\right)$
在源域数据上使用预训练的模型进行训练，对于目标样本，使用预测结果作为伪标签。在每次迭代计算一次局部中心（所有样本的平均值），并对源域以及目标域的中心进行加权更新：
$\begin{aligned} \rho_s &=\rho\left(a_{s(I)}^k, c_{s(I-1)}^k\right) \\ c_{s(I)}^k & \leftarrow \rho_s a_{s(I)}^k+\left(1-\rho_s\right) c_{s(I-1)}^k \\ \rho_t &=\rho\left(a_{t(I)}^k, c_{s(I-1)}^k\right) \\ c_{t(I)}^k & \leftarrow \rho_t a_{t(I)}^k+\left(1-\rho_t\right) c_{t(I-1)}^k \end{aligned}$
其中， $\rho\left(x_i, x_j\right)=\left(\frac{x_i \cdot x_j}{\left\|x_i\right\| \times\left\|x_j\right\|}+1\right) / 2$ 。
最后，分类中心对齐损失公式如下：
$\mathcal{L}_{c c a}=\sum_{k=1}^N \operatorname{dist}\left(c_{s(I)}^k, c_{t(I)}^k\right)$

3.4 语义对比映射（SCM）

对于目标域中的非质心样本，使用对比损失函数来鼓励已知样本靠近其质心，并强制未知样本远离已知类的所有质心。通过这种方式，可以在目标域中对齐非质心样本。此过程称为语义对比映射（SCM）。
由于目标样本的伪标签不正确，选择分类概率超过阈值的可靠样本。在本文方法中，将阈值设置为 $1/ (N + 1)$ 。SCM 旨在减小可靠已知样本与其质心之间的距离，同时扩大可靠未知样本与所有质心之间的间距。
$\mathcal{L}_{\text {con }}\left(x_t ; G\right)=(1-z) \mathcal{D}_k\left(x_t^k, c_s^k\right)-\frac{z}{N} \sum_{k=1}^N \mathcal{D}_u\left(x_t^k, c_s^k\right)$
其中， $z$ 是已知类的时候值为0，而为未知类的时候值为1， $D_k$ 表示目标域已知类与对应源域类别的距离， $D_u$ 表示目标域未知类与对应源域所有类别的距离。
$\begin{gathered} \mathcal{D}_k\left(x_t^k, c_s^k\right)=(1-\rho)^\omega \operatorname{dist}\left(x_t^k, c_s^k\right)^2 \\ \mathcal{D}_u\left(x_t^{N+1}, c_s^k\right)=-\rho^\omega\left(\max \left\{0, M^k-\operatorname{dist}\left(x_t^{N+1}, c_s^k\right)\right\}\right)^2 \end{gathered}$
其中 $ρ$ 表示余弦相似性。为了确保有效和准确地测量距离，我们还使用超参数 $ω$ 来重新计算损失中计算的距离。 $M^k$ 是用于测量类 $k$ 的邻域半径的分类自适应余量
$M^k=\frac{1}{N} \sum_{j=1, j \neq k}^N \operatorname{dist}\left(c_t^j, c_s^k\right)$

3.5 目标

final objective：
$\begin{aligned} \mathcal{L}_{\text {total }} &=\mathcal{L}_{A D A}+\mathcal{L}_{S C A}+\mathcal{L}_{S C M} \\ &=\mathcal{L}_{c l s}+\mathcal{L}_{a d v}+\lambda_s \mathcal{L}_{c c t}+\lambda_c \mathcal{L}_{c c a}+\lambda_t \mathcal{L}_{c o n} . \end{aligned}$
在每次迭代中，网络同时更新类质心和网络参数。
在这里插入图片描述

4 小结

预训练对抗网络中的生成器与鉴别器，先通过 ADA 初步进行源域各个类别的区分、目标域与源域相应类别的中心对齐、并初步形成目标域中已知样本与未知样本的边界。
通过 SCA 使每个已知类更加集中，源和目标之间的对齐更加准确，拉近已知类内部的表示，而加大各个已知类之间的区分。
使用 SCM 对于目标域中的非中心样本，鼓励已知样本向其中心靠近，并强制未知样本远离所有已知类的中心。

参考文献

[1] Q. Feng, G. Kang, H. Fan and Y. Yang, “Attract or Distract: Exploit the Margin of Open Set,” 2019 IEEE/CVF International Conference on Computer Vision (ICCV), 2019, pp. 7989-7998, doi: 10.1109/ICCV.2019.00808.
[2] https://zhuanlan.zhihu.com/p/363456100