sklearn 特征降维利器 —— PCA TSNE

PCA和TSNE都是降维工具,TSNE在保留样本差异性上更优,但计算速度较慢。通常先用PCA预处理,再用TSNE进行可视化。t-SNE基于低维特性假设,适用于高维数据降维,是流形学习的一部分。文章提供sklearn仿真实例和t-SNE算法介绍。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

                       

同为降维工具,二者的主要区别在于,

  • 所在的包不同(也即机制和原理不同)
    • from sklearn.decomposition import PCA
    • from sklearn.manifold import TSNE
  • 因为原理不同,导致,tsne 保留下的属性信息,更具代表性,也即最能体现样本间的差异;
  • TSNE 运行极慢,PCA 则相对较快;

因此更为一般的处理,尤其在展示(可视化)高维数据时,常常先用 PCA 进行降维,再使用 tsne:

data_pca = PCA(n_components=50).fit_transform(data)data_pca_tsne = TSNE(n_components=2).fit_transform(data_pca)
  
  
  
  • 1
  • 2

t-SNE(t-distribution Stochastic Neighbor Embedding)是目前最为流行的高维数据的降维算法。

t-SNE 成立的前提基于这样的一个假设:我们现实世界观察到的数据集,都在本质上有一种低维的特性(low intrinsic dimensionality),尽管它们嵌入在高维空间中,甚至可以说,高维数据经过降维后,在低维状态下,更能显现其本质特性,这其实也是流形学习(Manifold Learning)的基本思想。

原始论文请见,论文链接(pdf)<

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值