
数据降维
MCMAXMM
Python,深度学习,机器学习,推荐系统,分布式系统,golang
展开
-
Embedding Projector
Embedding Projector 是一款embedding 可视化化的工具,通过特定的降维算法如PCA,T-sne将原始数据降维到三维空间,我只需要导入我们的数据就可以可视化,非常方便,当然,你也可以使用sklearn中的tsne和PCA+matplotlib的方式来做embedding可视化,只不过有点麻烦。embedding projector 可以很方便的导入我们需要的数据...原创 2019-06-20 22:01:25 · 4543 阅读 · 6 评论 -
数据降维-核化线性降维(kernelized PCA)
主要是在传统的PCA中加入了kernel。传统的PCA使用的是线性变换,为此(Schoelkopf et al. 1998)在传统的PCA中引进了kernel的技巧,本文的主要参考文献为MLAPP,参考的是第14章的第四小节,算法如下:这个算法,和传统的pca差不多,主要步骤3和8主要是做特征空间的中心化,因为pca处理的是中心化后的数据,推断步骤如下:详细细节可以查看MLAPP这本书。...原创 2019-04-13 12:13:44 · 3058 阅读 · 1 评论 -
数据降维-主成分分析(PCA)
主成分分析(PCA)是一种比较经典的降维方法,它的思想主要是将数据映射到低维空间时使得数据在低维空间的方差最大。算法如下:python代码如下,我主要使用了两种方法特征值分解和奇异值分解。import numpy as npimport matplotlib.pyplot as pltfrom sklearn.utils.extmath import svd_flipcl...原创 2019-04-10 19:19:03 · 2378 阅读 · 1 评论 -
数据降维-多维尺度缩放(MDS)
多维尺度缩放(MDS)是一种比较经典的降维方法,它利用在低维度空间维持高维度空间的距离矩阵来学习数据在低维度空间的表示。算法如下:以上算法来自西瓜书的截图。python代码如下:#Multiple Dimensional Scaling,MDS,多维尺度缩放#数据是按照行来排列的#尽量让样本数目大于数据的维度import numpy as npimport matplo...原创 2019-04-10 16:00:06 · 2864 阅读 · 0 评论