主成分分析与MDS在鸢尾花数据集的应用

PCA与MDS在鸢尾花数据集的应用

最新推荐文章于 2025-10-13 15:41:04 发布

原创

最新推荐文章于 2025-10-13 15:41:04 发布 · 619 阅读

29 ·

CC 4.0 BY-SA版权

文章标签：

#主成分分析 # PCA # MDS

52、编写一个名为 BasicPCA 的类，该类包含两个方法：fit(X) 用于估计数据均值、主成分方向 V 以及每个成分的解释方差；transform(X) 用于将数据投影到主成分上。

import numpy as np

class BasicPCA:
    def fit(self, X):
        # 计算数据均值
        self.mean = np.mean(X, axis=0)
        # 数据中心化
        X_centered = X - self.mean
        # 计算协方差矩阵
        cov_matrix = np.cov(X_centered, rowvar=False)
        # 进行特征值分解
        eigenvalues, eigenvectors = np.linalg.eig(cov_matrix)
        # 特征值排序索引
        sorted_indices = np.argsort(eigenvalues)[::-1]
        # 排序后的特征值和特征向量
        self.explained_variance = eigenvalues[sorted_indices]
        self.V = eigenvectors[:, sorted_indices]
        return self

    def transform(self, X):
        # 数据中心化
        X_centered = X - self.mean
        # 投影到主成分上
        return np.dot(X_centered, self.V)