13、机器学习中的降维与异常检测及模型部署

最新推荐文章于 2025-11-24 11:51:29 发布

会议雕塑

最新推荐文章于 2025-11-24 11:51:29 发布

阅读量21

点赞数

CC 4.0 BY-SA版权

分类专栏：机器学习实战指南文章标签：机器学习降维异常检测

本文链接：https://blog.youkuaiyun.com/pandas7gardener/article/details/151604793

机器学习实战指南专栏收录该内容

31 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

机器学习中的降维与异常检测及模型部署

1. t - SNE 与数据聚类

t - SNE（t - Distributed Stochastic Neighbor Embedding）是一种用于高维数据可视化的技术。以下是使用 t - SNE 对数字数据集进行处理的代码：

%matplotlib inline
from sklearn.manifold import TSNE
from sklearn.datasets import load_digits
import matplotlib.pyplot as plt

digits = load_digits()
tsne = TSNE(n_components=2, init='pca', learning_rate='auto', random_state=0)
tsne_digits = tsne.fit_transform(digits.data)

plt.figure(figsize=(12, 8))
plt.scatter(tsne_digits[:, 0], tsne_digits[:, 1], c=digits.target, cmap=plt.cm.get_cmap('Paired', 10))
plt.colorbar(ticks=range(10))
plt.clim(-0.5, 9.5)

t - SNE 能较好地将数字组分离成不同的聚类，表明数据中存在机器学习可利用的模式。不过，t - SNE 计算量较大，在处理大型数据集时可能耗时过长。可以采取以下策略来缓解这一问题：
- 在数据集的子集上运行 t - SNE，而非