《大数据机器学习实践探索》---- 数据分析之特征工程（ Feature Engineering）：降维（非监督学习之PCA降维&流行学习TSNE）

最新推荐文章于 2025-05-03 02:58:18 发布

shiter

最新推荐文章于 2025-05-03 02:58:18 发布

阅读量494

点赞数

CC 4.0 BY-SA版权

分类专栏：大数据机器学习实践探索基于大数据的机器学习原理与最佳实践文章标签： pca 降维特征工程

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/wangyaninglm/article/details/115269596

大数据机器学习实践探索同时被 2 个专栏收录

130 篇文章 ¥29.90 ¥99.00

订阅专栏

超级会员免费看

基于大数据的机器学习原理与最佳实践

83 篇文章 ¥29.90 ¥99.00

订阅专栏

超级会员免费看

文章大纲

1.PCA简介
2.PCA实例
3.T-SNE简介
4.T_SNE实例

1.PCA简介

使用非监督学习的方式进行数据变换有非常广泛的用途。最常见的目的就是对数据进行可视化，将数据进行压缩并为进一步处理得到一个更有效的数据表示。这其中最有效使用最广泛的技术要数PCA（Principal Component Analysis）了。

主成分分析（PCA）是一种以某种方式旋转数据集的方法，使得旋转特征在统计学上不相关。这种旋转通常是根据它们能够解释数据的能力的重要性来选择新特征的子集。

这里写图片描述

第一个图显示原始数据点，着色以区分点。算法首先找出最大方差的方向，标记为“分量1“。这是数据中包含大多数信息的方向，或者换句话说，这是每一个特征最相关的方向。然后，算法找到与第一方向正交（在直角）时包含最多信息的方向。在二维空间中，只有一个可能的方向是直角，但是在高维空间中会有无穷多个正交方向。通过这种方式找到的方向称之为“Principal Component”，它代表了数据方差的主要方向。

第二个图显示相同的数据，但现在旋转，使得第一主成分与x轴对齐，第二主成分与y轴对齐。在旋转之前，从数据中减去平均值，使得变换数据以零为中心。在PCA发现的旋转表示中，两个轴是不相关的，这意味着该表示中的数据的相关矩阵，除了对角线之外是零。我们可以通过只保留一些主成分来使用PCA进行维数约简。在这个例子中，我们可能只保留第一个主成分，如图三显示。

这将数据从二维数据集减少到一维数据集。但我

了解本专栏

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

shiter 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。