Python机器学习及实践——基础篇:无监督学习经典模型(特征降维)
特征降维不仅可以重构有效的低维度特征向量,同时也为数据展现提供了可能。在特征降维的方法种,主成分分析(Principal Component Analysis, PCA)是最为经典和实用的特征降维技术,特别是辅助图像识别方法有突出的表现。
1.主成分分析
线性相关矩阵秩计算样例
import numpy as np
# 初始化一个2*2的线性相关矩阵
M = np.array([[1, 2], [2, 4]])
# 计算2*2线性相关矩阵的秩
print(np.linalg.matrix_rank(M, tol=None))
PCA的思想是首先把原来的特征空间做了映射,使得新的映射后特征空间数据彼此正交。这样一来,通过主成分分析就尽可能保留下具备区分性的低维数据特征。
应用案例:手写体数字图像识别
显示手写体数字图片经PCA压缩后的二维空间分布
#!/usr/bin/env python
# -*- coding: utf-8 -*-
"""
@File : PCAdigits.py
@Author: Xinzhe.