14、数据降维技术:PCA、LDA与KPCA详解

数据降维技术:PCA、LDA与KPCA详解

1. 主成分分析(PCA)

PCA是一种无监督的线性变换技术,旨在找到数据集中方差最大的正交分量轴。以下是使用Python和 scikit-learn 库实现PCA的详细步骤。

1.1 数据可视化

首先,我们可以通过以下代码对经过PCA降维后的数据进行可视化:

import numpy as np
import matplotlib.pyplot as plt

colors = ['r', 'b', 'g']
markers = ['s', 'x', 'o']
for l, c, m in zip(np.unique(y_train), colors, markers):
    plt.scatter(X_train_pca[y_train==l, 0], 
                X_train_pca[y_train==l, 1], 
                c=c, label=l, marker=m)
plt.xlabel('PC 1')
plt.ylabel('PC 2')
plt.legend(loc='lower left')
plt.tight_layout()
plt.show()

从可视化结果可以看出,数据在第一个主成分(x轴)上的分布比第二个主成分(y轴)更分散,这与之前计算的解释方差比图一致。同时,线性分类器很可能能够很好地分离这些类别。

1.2 使用 scikit-learn 实现PCA
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值