
作者:Peter
红色石头的个人网站:
红色石头的个人博客-机器学习、深度学习之路www.redstonewill.com
系列文章:
吴恩达《Machine Learning》精炼笔记 1:监督学习与非监督学习
吴恩达《Machine Learning》精炼笔记 2:梯度下降与正规方程
吴恩达《Machine Learning》精炼笔记 3:回归问题和正则化
吴恩达《Machine Learning》精炼笔记 4:神经网络基础
吴恩达《Machine Learning》精炼笔记 5:神经网络
吴恩达《Machine Learning》精炼笔记 6:关于机器学习的建议
吴恩达《Machine Learning》精炼笔记 7:支持向量机 SVM
吴恩达《Machine Learning》精炼笔记 8:聚类 KMeans 及其 Python实现
在本文中主要介绍的是数据降维相关的内容,重点讲解了PCA算法
- 为什么要实施降维
- 数据压缩
- 数据可视化
- PCA算法
- PCA和线性回归算法的区别
- PCA算法特点
- Python实现PCA
- sklearn中实现PCA
为何降维
在现实高维数据情况下,会有数据样本稀疏、距离计算困难等问题,被称为维数灾难。
解决的方法就是降维,也称之为“维数约简”,即通过某种数据方法将原始高维属性空间转成一个低维“子空间”。在这个子空间中,样本密度大大提高,将高维空间中的一个低维“嵌入”。

降维Dimensionality Reduction
数据降维主要是有两个动机:
- 数据压缩Data Compression