视频地址:https://www.bilibili.com/video/BV1aE411o7qd?p=22
笔记地址:https://www.yuque.com/books/share/f4031f65-70c1-4909-ba01-c47c31398466/kg2npf
P22 降维1 - 背景

本节内容:用 立方体内接球体积占比 和 套球体环形带体积占比 两个例子,从几何角度阐述了维度灾难。
维度灾难的几何理解:
https://zhuanlan.zhihu.com/p/27488363
解决过拟合问题的方法:①增加数据 ②正则化 ③降维。
降维的分类方法:
①直接降维:特征选择 / Lasso导致的参数稀疏
②线性降维:PCA / MDS
③非线性降维:流型
P23 降维2 - 样本均值&样本方差矩阵

本节内容:将协方差矩阵推导成中心矩阵H的形式。
中心矩阵H的形式:

中心矩阵H的性质:
①H是实对称矩阵,也自然是半正定矩阵。HT=H

本文深入探讨了PCA的几何理解,包括立方体内接球和套球体积占比,以及如何通过中心矩阵和协方差矩阵来解决过拟合。讲解了最大投影方差和最小重构代价的计算过程,并揭示了PCA与SVD、PCoA的关系。从概率角度和实际应用角度解析了PCA在主坐标分析中的角色。
最低0.47元/天 解锁文章
3345

被折叠的 条评论
为什么被折叠?



