机器学习-特征降维

部署运行你感兴趣的模型镜像

机器学习中的数据维度与真实世界的维度本同末离。机器学习中,通常需要将现实世界中的数据进行转化,形成计算机能够处理的数据向量的形式,而往往为了学习到较好的模型,需要的数据向量维度都是非常大的。从而导致了学习一个模型或者算法往往需要大量的资源的消耗,有时甚至产生维度灾难的问题。因此, 为了缓解这一问题,又能够保留大部分特征的贡献学习到较好的模型,数据特征降维,即使用一个较低维的数据向量表达高位数据向量能够表达的大部分信息,显得尤为重要。

常见的特征降维方法有:

主成分分析

线性判别分析

等距映射

局部线性嵌入

拉普拉斯特征映射

局部保留投影

等...

 

转载于:https://www.cnblogs.com/wzhao-cn/p/11271045.html

您可能感兴趣的与本文相关的镜像

Yolo-v8.3

Yolo-v8.3

Yolo

YOLO(You Only Look Once)是一种流行的物体检测和图像分割模型,由华盛顿大学的Joseph Redmon 和Ali Farhadi 开发。 YOLO 于2015 年推出,因其高速和高精度而广受欢迎

### 机器学习中的特征方法及其实现 #### 主成分分析(PCA) 主成分分析是一种经典的线性技术,旨在通过寻找数据的主要方向来减少度的同时尽可能保持原始数据的方差。其实现基于协方差矩阵的特征分解或奇异值分解(SVD)。PCA的核心目标是最小化投影误差,从而最大化保留的数据信息。 以下是使用Python实现PCA的一个简单例子: ```python from sklearn.decomposition import PCA import numpy as np # 假设X是我们要数据集 X = np.random.rand(100, 10) # 创建PCA模型实例,指定后的度为2 pca = PCA(n_components=2) X_pca = pca.fit_transform(X) print(f"前形状: {X.shape}, 后形状: {X_pca.shape}") ``` 这种方法适用于线性可分的数据结构[^1]。 --- #### t-分布随机邻域嵌入(t-SNE) t-SNE是一种非线性的算法,特别适合于高数据的可视化。它的主要思想是将高空间中的相似度转换为概率分布,并在低空间中最小化这两个分布之间的KL散度。这使得t-SNE能够在二或三平面上很好地展现复杂的数据簇关系。 下面是利用`t-SNE`进行的代码示例: ```python from sklearn.manifold import TSNE import matplotlib.pyplot as plt # 使用相同的X作为输入数据 tsne = TSNE(n_components=2, perplexity=30, random_state=42) X_tsne = tsne.fit_transform(X) plt.scatter(X_tsne[:, 0], X_tsne[:, 1]) plt.title('t-SNE Visualization') plt.show() ``` 需要注意的是,尽管t-SNE擅长捕捉局部结构,但它可能会丢失全局结构信息,因此不建议将其用于分类任务之外的目的[^2]。 --- #### PCA与t-SNE的区别 | **特性** | **PCA** | **t-SNE** | |------------------|------------------------------------------------------------------------------------------|--------------------------------------------------------------------------------------------| | 数据假设 | 假设数据呈线性分布 | 不假定任何特定分布形式 | | 计算效率 | 高效,尤其对于大规模数据 | 较慢,尤其是当样本数量较大时 | | 应用场景 | 度压缩、噪声过滤 | 数据可视化 | 虽然两者都可以用来数据度,但它们的应用领域有所不同。例如,PCA更适合处理线性问题,而t-SNE则能更好地反映数据间的非线性关系[^3]。 ---
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值