机器学习---数据的降维---机器学习算法分类以及开发流程

本文介绍了机器学习中的特征选择方法,包括手动筛选和方差过滤,强调了去除冗余特征的重要性。接着讲解了主成分分析PCA,用于降维而不损失数据信息。还提供了一个PCA的案例,并提及了机器学习算法的分类和开发流程。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

特征选择

在这里插入图片描述
在这里插入图片描述在这里插入图片描述
也作为机器学习的数据输入。
在这里插入图片描述
在这里插入图片描述
有一些特征不需要,即可以删除。有一些特征对于结果会有影响。
在这里插入图片描述
特征选择:1手动选择哪些特征需要,哪些不需要。
2若公司给了数据,不好一列一列去看什么特点,数据分布如何,几千万个样本都去看肯定不可以,所以用一些工具进行特征选择。
在这里插入图片描述
方差过滤方法:即若某一列方差都一样,即肯定这一列不能作为问题分析的特征了。可以指定方差的大小来过滤,这样可以将相同的,冗余没用的特征都给他删除掉。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
将样本特征值都相同的特征删除掉了。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

主成分分析–降维在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
降维度,即将维度数降低,但是不能将数据代表的意思信息减少,即将维度降低,但是里面的信息幷没有损耗,即PCA–将高纬度简化为低维度。
在这里插入图片描述
当特征数量不多时,不用PCA。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
PCA用于简化数据集,但是可将损失降低到最小。
PCA就是找到这样最好的一条直线即可。
在这里插入图片描述
在这里插入图片描述
三维就是找一个平面映射即可。数据量减少了。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

PCA案例

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
即先把每张表读出来,按照相同的字段特征进行合并。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
交叉分组:行就是用户ID,列就是一个个各种类型的物品
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
所以要进行主成分分析,即降维度,然后输入到算法中。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

机器学习算法分类以及开发流程

在这里插入图片描述
在这里插入图片描述
利用库和框架做。
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述在这里插入图片描述在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
预测具体的值,如票房数据即连续,而预测具体的类别则用离散数据。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述在这里插入图片描述在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

机器学习开发流程

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值