python t-sne降维可视化, 显示类别名称, 多种颜色

 

博主比较懒,不想写描述了。不过只要愿意静下心来看一下代码,应该会很有收获。

只显示样本点,不显示类别名称,效果如下:

X_tsne = tsne.fit_transform(dataset_x)  # dataset [N, dim]
x_min, x_max = X_tsne.min(0), X_tsne.max(0)
X_norm = (X_tsne-x_min)/(x_max-x_min)  
plt.figure(figsize=(8,8))
colors = cm.rainbow(np.linspace(0,1,len(label)))    # 定义多种颜色
for i in range(len(X_norm)):
    plt.text(X_norm[i,0], X_norm[i,1], '.', color=colors[label[i]],fontdict={'weight': 'bold', 'size':9})
plt.xticks([])
plt.yticks([])
plt.title('test')
plt.savefig('cluster.jpg')
plt.show()

如果想看出每种颜色到底代表哪一类,那么需要将类别名称也要画上去。

问题在于怎么将类别名称定位到图片中的位置呢?

解决方案:将每一个簇求均值,作为这个类的中心点。

完整代码:

内容概要:本文详细介绍了利用 Python 实现 t-SNE 可视化的过程及其应用价值。首先讨论了高数据所带来的“度灾难”这一难题,并指出了 t-SNE 如何作为一种有效的解决方案来应对这种情况。接着深入剖析了 t-SNE 工作机制——该算法致力于保存高空间中的局部结构特性并在二或者三的空间内再现出来。随后,文中给出了完整的项目流程,涵盖数据加载与预处理、处理再到最后可视化呈现步骤的具体说明;与此同时提及了几项关键技术和优化措施用以提升计算效率与准确度。此外,作者强调了几个实际应用场景,证明了这一技术能够在计算机视觉、自然语言处理等多个领域发挥重要作用。 适用人群:适用于从事数据科学研究和技术开发者,尤其是那些希望掌握更多关于高数据理解和技巧的人士。 使用场景及目标:本教程的目标是为了使高数据可以通过直观的方式被展示出来。对于使用者来说,它可以用于评估现有数据集,探索未明模式或群体结构,或是作为工具来进行更高级别建模之前的特征工程准备阶段。另外也可供教育目的使用,教授学生有关现代方法的知识以及编程实践经验。 其他说明:考虑到性能限制及其它因素的影响,在实践中应注意调整相关参数以达到最佳表现,并且充分认识到可视化结果背后可能存在一定的不确定性和解释边界。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值