* MVU算法
** 基本思想
Weinberger和Saul提出的最大差异展开算法(MVU),也可以称为半正定嵌入算法(Semi-definite Embedding, SDE),基本思想是:假设样本点中每个点都和其k近邻点组成近邻图,那么可以找到一种映射使得非近邻点之间的距离映射到低维空间后最大,那么就可以得到嵌入后的映射关系.
** 算法步骤
1) 构造近邻图
每个数据点都与其他k近邻点链接并且保存所有存在的近邻关系的数据点都互相连接,如果通过这种方法建立近邻图比较忠实保留数据点的流形结构.
2) 半正定规划近邻图的Gram矩阵
保持近邻图中所有边的欧氏距离,低维坐标中心化和内积半正定三个约束条件下,建立目标函数,使得Gram矩阵的迹最大,并且通过半正定规划出Gram矩阵,使得高位数据全局结构的伸展.这种方式得到的不是直接的原始数据的伸展后的输出,而是半正定规划后,找到在近邻图中不连接的两个点之间距离和最大的内积矩阵.
3) 谱分解
对Gram矩阵使用MDS方法,得到在低维空间的嵌入结果.
** 算法分析
MVU算法保持前后近邻距离和角度不变,同时使得非近邻点在低维空间尽可能的远的情况下展开高维数据的学习方法,是一种保持全局特性的方法,但是不需要高维观测数据间的测地距离,所以对非凸函的数据集也有效果.
对噪声较为敏感,因为算法求解Gram使用了严格的局部等距约束,使得有噪声的数据的低维嵌入效果不是非常好.
如果从算法时间复杂度分析,求解半定规划需要O(k^3n^3),对Gram进行广义特征值分解需要O(n^3),所以不大适合对于大规模数据的分解变换.
** 基本思想
Weinberger和Saul提出的最大差异展开算法(MVU),也可以称为半正定嵌入算法(Semi-definite Embedding, SDE),基本思想是:假设样本点中每个点都和其k近邻点组成近邻图,那么可以找到一种映射使得非近邻点之间的距离映射到低维空间后最大,那么就可以得到嵌入后的映射关系.
** 算法步骤
1) 构造近邻图
每个数据点都与其他k近邻点链接并且保存所有存在的近邻关系的数据点都互相连接,如果通过这种方法建立近邻图比较忠实保留数据点的流形结构.
2) 半正定规划近邻图的Gram矩阵
保持近邻图中所有边的欧氏距离,低维坐标中心化和内积半正定三个约束条件下,建立目标函数,使得Gram矩阵的迹最大,并且通过半正定规划出Gram矩阵,使得高位数据全局结构的伸展.这种方式得到的不是直接的原始数据的伸展后的输出,而是半正定规划后,找到在近邻图中不连接的两个点之间距离和最大的内积矩阵.
3) 谱分解
对Gram矩阵使用MDS方法,得到在低维空间的嵌入结果.
** 算法分析
MVU算法保持前后近邻距离和角度不变,同时使得非近邻点在低维空间尽可能的远的情况下展开高维数据的学习方法,是一种保持全局特性的方法,但是不需要高维观测数据间的测地距离,所以对非凸函的数据集也有效果.
对噪声较为敏感,因为算法求解Gram使用了严格的局部等距约束,使得有噪声的数据的低维嵌入效果不是非常好.
如果从算法时间复杂度分析,求解半定规划需要O(k^3n^3),对Gram进行广义特征值分解需要O(n^3),所以不大适合对于大规模数据的分解变换.