监督降维技术全解析
在数据科学和机器学习领域,降维是一项至关重要的技术,它能够在减少数据维度的同时保留关键信息。监督降维作为降维技术的一个重要分支,结合了数据的标签信息,旨在提高降维效果和分类性能。本文将深入探讨监督降维的多种方法,包括基于类纯度的参数化方法、度量学习、类自适应尺度以及类引导原则等。
1. 基于类纯度的参数化方法
1.1 线性判别分析(LDA)
线性判别分析(LDA),有时也被称为费舍尔判别分析(FDA),是一种经典的监督降维方法。它通过一个矩阵 (P)(大小为 (\delta \times d))进行正交线性投影,该投影旨在最大化嵌入空间中类间方差与类内方差的比值。在应用 LDA 时,通常将嵌入维度 (d) 设置为 (n - 1),其中 (n) 是类的数量。
具体来说,LDA 解决的优化问题为:
(\arg\max_{p^{\top}p = 1} \frac{p^{\top}C_{\not\in\tilde{\Omega}}p}{p^{\top}C_{\in\tilde{\Omega}}p})
其中,协方差矩阵 (C_{\in\tilde{\Omega}} \triangleq \frac{1}{N} \tilde{\Omega} C^{\top} \tilde{\Omega}_C) 表示类内的离散程度,(\tilde{\Omega}_C) 是一个 (N \times \delta) 的矩阵,其行是经过类中心中心化后的点 (\xi_i - \mu {L_i});协方差矩阵 (C_{\not\in\tilde{\Omega}} \triangleq \tilde{M} C^{\t
监督降维技术方法解析与应用
超级会员免费看
订阅专栏 解锁全文
32

被折叠的 条评论
为什么被折叠?



