scikit-learn:4. 数据集预处理(clean数据、reduce降维、expand增维、generate特征提取)

本文介绍了scikit-learn的数据预处理,涵盖数据清洗、PCA降维、Kernel增维和特征提取等。通过fit、transform和fit_transform了解模型参数学习和转换过程,并提供了多个预处理方法的详细链接。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

本文参考:http://scikit-learn.org/stable/data_transforms.html


本篇主要讲数据预处理,包括四部分:

数据清洗、数据降维(PCA类)、数据增维(Kernel类)、提取自定义特征。哇哈哈,还是关注预处理比较靠谱。。。。

重要的不翻译:scikit-learn providesa library of transformers, which mayclean (see Preprocessing data), reduce (seeUnsupervised dimensionality reduction), expand (see Kernel Approximation) or generate (see Feature extraction) feature representations.


fit、transform、fit_transform三者区别:

fit:从训练集中学习模型的参数(例如,方差、中位数等;也可能是不同的词汇表)

transform:将训练集/测试集中的数据转换为fit学到的参数的维度上(测试集的方差、中位数等;测试集在fit得到的词汇表下的向量值等)。

fit_transform:同时进行fit和transform操作。

Like other estimators, these are represented by classes with fit

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值