1 数据处理

本文探讨了在鸢尾花数据集上应用PCA降维技术的过程。通过计算特征值和特征向量,选取两个最大特征值对应的特征向量进行数据降维。同时,介绍了在车辆数据描述中使用独热编码的技巧。

1.数据抽取有用特征值

  • 在鸾尾花的数据中,共有四个特征值,150条数据
  • 将X^T * X 形成4*4的对称矩阵
  • 求4个特征值,以及对应的四个正交特征向量
  • 取两个特征值最大的特征对应的特征向量,作为标准方向
  • 将剩余的两列特征值投影
    原理:其实特征值最大的就是离散程度最高的,用这两个做标注方向,特征值不至于损失太多

2.车辆数据描述

用0, 1, 2, 3表示特征值在参数前方加入参数还是挺麻烦的,于是用在这里插入图片描述独热编码

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值