迁移学习基础知识——其他度量准则(KL散度与JS距离、MMD、PA、A-distance、HSIC)

Hi,大家好,我是半亩花海。在上节说明了迁移学习领域的总体思路和度量准则(距离和相似度)之后,本文主要将介绍迁移学习的其他度量准则(这里主要说明的是几种分布距离度量方法,诸如KL散度与JS距离、MMD、PA、A-distance、HSIC)。首先讲解了KL散度(非对称相对熵)和JS距离(对称化改进),然后重点分析了最大均值差异(MMD)及其多核扩展MK-MMD,该方法通过核映射在高维空间计算分布差异。此外还介绍了PA方法(计算格拉斯曼流形上的主角度)、A-distance(基于分类器损失的领域差异度量)以及HSIC(希尔伯特空间独立性检验)。

目录

一、KL散度与JS距离

(1)KL散度

(2)JS距离

二、最大均值差异 (MMD)

三、Principal angle (PA)

四、A-distance

五、Hilbert-Schmidt Independence Criterion (HSIC)

六、参考资料


一、KL散度与JS距离

KL 散度和 JS 距离是迁移学习中被广泛应用的度量手段。

(1)KL散度

Kullback–Leibler divergence,又叫做相对熵,衡量两个概率分布 P(x), Q(x) 的距离:

这是一个非对称距离:

(2)JS距离

Jensen–Shannon divergence,基于 KL 散度发展而来,是对称度量:

其中


二、最大均值差异 (MMD)

最大均值差异是迁移学习中使用频率最高的度量。Maximum mean discrepancy,它度量在再生希尔伯特空间中两个分布的距离,是一种核学习方法。两个随机变量的距离为:

其中 ϕ(·) 是映射,用于把原变量映射到再生核希尔伯特空间 (Reproducing Kernel Hilbert Space, RKHS) 中。什么是 RKHS?形式化定义太复杂,简单来说就是这个空间是对于函数的内积完备的。就是比欧几里得空间更高端的。

理解:就是求两堆数据在 RKHS 中的均值的距离。

多核的 MMD:Multiple-kernel MMD,简称 MK-MMD。现有的 MMD 方法是基于单一核变换的,多核的 MMD 假设最优的核可以由多个核线性组合得,而MK-MMD 在许多后来的方法中被大量使用。


三、Principal angle (PA)

也是将两个分布映射到高维空间 (格拉斯曼流形) 中,在流形中两堆数据就可以看成两个点。Principal angle 是求这两堆数据的对应维度的夹角之和。

对于两个矩阵 \mathbf{X},\mathbf{Y},计算方法:首先正交化 (用 PCA) 两个矩阵,然后:

其中 m, n 分别是两个矩阵的维度,\theta_{i} 是两个矩阵第 i 个维度的夹角,\Theta = {\theta_{1}, \theta_{2}, \cdot \cdot \cdot, \theta_{t}} 是两个矩阵 SVD 后的角度:


四、A-distance

A-distance 是一个很简单却很有用的度量。2007年的一篇经典文献中介绍了此距离,它可以用来估计不同分布之间的差异性。A-distance 被定义为建立一个线性分类器来区分两个数据领域的 hinge 损失 (也就是进行二类分类的 hinge 损失)。它的计算方式是,我们首先在源域和目标域上训练一个二分类器 h,使得这个分类器可以区分样本是来自于哪一个领域。我们用 err(h) 来表示分类器的损失,则 A-distance 定义为:

A-distance 通常被用来计算两个领域数据的相似性程度,以便与实验结果进行验证对比。


五、Hilbert-Schmidt Independence Criterion (HSIC)

希尔伯特-施密特独立性系数,Hilbert-Schmidt Independence Criterion,用来检验两组数据的独立性:

其中,X, Y 是两堆数据的 kernel 形式。


六、参考资料

1. 王晋东《迁移学习简明手册》(PDF版) https://www.labxing.com/files/lab_publications/615-1533737180-LiEa0mQe.pdf#page=82&zoom=100,120,392

2. 《迁移学习简明手册》发布啦! https://zhuanlan.zhihu.com/p/35352154

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

半亩花海

你的鼓励将是我创作的最大动力!

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值