TSNE降维与可视化

t-SNE是一种强大的降维方法,它将高维数据转化为二维空间,同时兼顾局部和全局相似度,使得数据簇内分布均匀,边界清晰,尤其适合数据可视化。在深度学习中,t-SNE也可用于解析模型输出。了解更多信息可参考相关教程:t-SNE实践——sklearn教程。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

TSNE是一种降维与可视化技术,可以将数据点之间的相似度转换为概率。在原空间(高维空间)中转化为基于高斯分布的概率;在嵌入空间(二维空间)中转化为基于t分布的概率。这使得t-SNE不仅可以关注局部(SNE只关注相邻点之间的相似度映射而忽略了全局之间的相似度映射,使得可视化后的边界不明显),还关注全局,使可视化效果更好(簇内不会过于集中,簇间边界明显)。也可以应用于深度学习中,将最后一 层得到的输出进行TSNE降维。

有兴趣的朋友可以看这篇博客:t-SNE实践——sklearn教程

https://blog.youkuaiyun.com/hustqb/article/details/80628721



"""t-SNE对手写数字进行可视化"""
import numpy as np
from sklearn.manifold import TSNE

from time import time
import matplotlib.pyplot as plt
from sklearn import datasets

def get_data():
    digits = datasets.load_digits(n_class=6)
    data = digits.data                          # (1083,64)
    label = digits.target                       # (1083,)
    n_samples, n_features = data.shape
    return data, label, n_samples, n_features

### t-SNE原理 t-SNE(t分布随机邻域嵌入)是一种用于高数据可视化的机器学习算法。该技术通过将高空间中的复杂结构映射到低空间来实现这一点,通常为二或三以便于人类理解[^1]。 #### 局部相似性优化 t-SNE的核心在于其专注于保持样本之间的局部关系而非全局几何特性。具体来说,在原始高空间中彼此接近的数据点会被转换成在低表示里同样靠近的位置;而相距较远的对象则不必持相同的相对位置。这种处理方式使得t-SNE特别适合捕捉并展现簇状模式以及内部细微差别[^2]。 然而值得注意的是,因为只强调局部特征而导致可能出现的空间扭曲现象——即某些部分被过度拉伸或者收缩,这可能导致解释上的偏差。 ### 应用场景 尽管存在上述提到的一些局限性,t-SNE仍然广泛应用于多个领域: - **气候研究**:分析气象参数间复杂的相互作用; - **计算机安全**:识别恶意软件行为模式; - **生物信息学癌症研究**:揭示基因表达谱型内的潜在联系; - **图像处理**:辅助理解和分类图片集中的视觉元素。 需要注意的是,虽然可以利用t-SNE的结果作为后续建模过程的一部分,但由于每次执行产生的布局可能不同,所以不适合直接用于训练监督式学习模型。相反,更多是用来支持探索性和描述性的数据分析工作。 ```python import numpy as np from sklearn.manifold import TSNE X = np.array([[0, 0, 0], [0, 1, 1], [1, 0, 1], [1, 1, 1]]) model = TSNE(n_components=2, random_state=0) np.set_printoptions(suppress=True) print(model.fit_transform(X)) ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值