13、机器学习中的降维与异常检测及模型部署

机器学习中的降维与异常检测及模型部署

1. t - SNE 与数据聚类

t - SNE(t - Distributed Stochastic Neighbor Embedding)是一种用于高维数据可视化的技术。以下是使用 t - SNE 对数字数据集进行处理的代码:

%matplotlib inline
from sklearn.manifold import TSNE
from sklearn.datasets import load_digits
import matplotlib.pyplot as plt

digits = load_digits()
tsne = TSNE(n_components=2, init='pca', learning_rate='auto', random_state=0)
tsne_digits = tsne.fit_transform(digits.data)

plt.figure(figsize=(12, 8))
plt.scatter(tsne_digits[:, 0], tsne_digits[:, 1], c=digits.target, cmap=plt.cm.get_cmap('Paired', 10))
plt.colorbar(ticks=range(10))
plt.clim(-0.5, 9.5)

t - SNE 能较好地将数字组分离成不同的聚类,表明数据中存在机器学习可利用的模式。不过,t - SNE 计算量较大,在处理大型数据集时可能耗时过长。可以采取以下策略来缓解这一问题:
- 在数据集的子集上运行 t - SNE,而非

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值