处理不完整多视图数据中的核矩阵-优快云博客

本文链接：https://blog.youkuaiyun.com/weixin_50569789/article/details/143836659

通过一个简单的例子来具体说明如何处理不完整多视图数据中的核矩阵 $K_v$ 。假设我们有一个包含三个视图的数据集，每个视图有四个样本。但是，第三个样本在第二个视图中缺失，第四个样本在第三个视图中缺失。

假设的核矩阵

视图 1 ( $K_1$ )：

$K_1 = \begin{pmatrix} 1 & 0.8 & 0.7 & 0.6 \\ 0.8 & 1 & 0.5 & 0.4 \\ 0.7 & 0.5 & 1 & 0.3 \\ 0.6 & 0.4 & 0.3 & 1 \end{pmatrix}$

视图 2 ( $K_2$ )：

$K_2 = \begin{pmatrix} 1 & 0.7 & - & 0.5 \\ 0.7 & 1 & - & 0.6 \\ -& - & - & - \\ 0.5 & 0.6 & - & 1 \end{pmatrix}$

视图 3 ( $K_3$ )：

$K_3 = \begin{pmatrix} 1 & 0.6 & 0.5 & - \\ 0.6 & 1 & 0.4 & - \\ 0.5 & 0.4 & 1 & - \\ -& - & - & - \end{pmatrix}$

（注：‘-’ 表示缺失值）

处理步骤

初始化：对于每个视图，将缺失的值初始化为零。
- $K_2$ 初始化后：
  $K_2 = \begin{pmatrix} 1 & 0.7 & 0 & 0.5 \\ 0.7 & 1 & 0 & 0.6 \\ 0 & 0 & 0 & 0 \\ 0.5 & 0.6 & 0 & 1 \end{pmatrix}$
- $K_3$ 初始化后：
  $K_3 = \begin{pmatrix} 1 & 0.6 & 0.5 & 0 \\ 0.6 & 1 & 0.4 & 0 \\ 0.5 & 0.4 & 1 & 0 \\ 0 & 0 & 0 & 0 \end{pmatrix}$
相似性图构建：基于初始化后的核矩阵 $K_1$ 、 $K_2$ 和 $K_3$ 构建相似性图。这个图反映了不同数据点之间的关系。
核矩阵补全：使用构建的相似性图来指导缺失核矩阵 $K_v$ 的补全。例如，假设我们已经构建了一个初步的相似性图，发现第一个样本和第三个样本在视图 1 中非常相似，那么可以推测它们在视图 2 和视图 3 中也可能相似。因此，可以尝试用相似性图中的信息来补全 $K_2$ 和 $K_3$ 中的缺失值。
- 补全 $K_2$ ：
  $K_2 = \begin{pmatrix} 1 & 0.7 & 0.7 & 0.5 \\ 0.7 & 1 & 0.5 & 0.6 \\ 0.7 & 0.5 & 1 & 0.4 \\ 0.5 & 0.6 & 0.4 & 1 \end{pmatrix}$
- 补全 $K_3$ ：
  $K_3 = \begin{pmatrix} 1 & 0.6 & 0.5 & 0.4 \\ 0.6 & 1 & 0.4 & 0.3 \\ 0.5 & 0.4 & 1 & 0.3 \\ 0.4 & 0.3 & 0.3 & 1 \end{pmatrix}$
迭代优化：在后续的迭代中，利用更新后的核矩阵重新构建相似性图，再用新的相似性图进一步改进核矩阵的补全。这个过程不断循环，直到达到预设的停止条件，如迭代次数或变化幅度小于某个阈值。
聚类分析：最终，基于补全后的核矩阵和相似性图进行聚类分析，得到最终的聚类结果。