徒手写代码之《机器学习实战》----PCA算法(1)(利用PCA对半导体制造数据降维)

本文通过PCA算法对半导体制造数据进行降维处理,详细步骤包括数据导入、NaN处理、数据预处理、协方差与特征值分析、主成分方差比计算以及保留前6大特征值的PCA降维操作。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

利用 PCA 对半导体制造数据降维

说明:

secom.data 放在当前目录下。

from numpy import *
import numpy as np

PCA 算法

def pca(dataMat, topNfeat=9999999):
    #计算均值
    meanVals = dataMat.mean(0)
    #去均值化,均值变为0
    meanRemoved = dataMat - meanVals #remove 
    #计算协方差矩阵
    covMat = cov(meanRemoved, rowvar=0)
    #计算协方差矩阵的特征值和特征向量
    eigVals,eigVects = linalg.eig(mat(covMat))
    #对特征值排序,argsort函数默认是从小到大排序的,返回对应的索引值
    eigValInd = argsort(eigVals)            #sort, sort goes smallest to largest
    #提取出最大的N个特征对应的索引
    eigValInd = eigValInd[:-(topNfeat+1):-1]  #cut off unwanted dimensio
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值