机器学习中的降维与无监督学习技术
1. 降维技术概述
在处理高维数据时,降维是一项重要的技术。它可以减少数据的复杂性,提高算法的效率,并帮助我们更好地理解数据。下面将介绍几种常见的降维技术。
1.1 KernelPCA的逆变换
默认情况下, fit_inverse_transform=False , KernelPCA 没有 inverse_transform() 方法。只有当设置 fit_inverse_transform=True 时,该方法才会被创建。之后可以计算重构原像误差,示例代码如下:
from sklearn.metrics import mean_squared_error
mean_squared_error(X, X_preimage)
可以使用网格搜索和交叉验证来找到使该误差最小化的核函数和超参数。
1.2 局部线性嵌入(LLE)
LLE是一种强大的非线性降维技术,它是一种流形学习技术,不依赖于投影。其工作原理是首先测量每个训练实例与其最近邻的线性关系,然后寻找一个低维表示,以最好地保留这些局部关系。
使用Scikit-Learn的 LocallyLinearEmbedding 类对瑞士卷数据集进行展开的代码如下:
from sklearn.
超级会员免费看
订阅专栏 解锁全文
3753

被折叠的 条评论
为什么被折叠?



