【散布矩阵】PCA 协方差矩阵

阿多2233

于 2023-06-11 11:36:30 发布

阅读量1.4k

点赞数 7

文章标签：矩阵机器学习线性代数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_45026269/article/details/131151569

版权

文章介绍了散布矩阵的概念，它是用于分析多元数据集合中变量间关系的工具，特别是在统计学和机器学习中用于理解和估计方差、协方差和相关性。PCA算法是降维方法之一，通过计算散布矩阵和协方差矩阵，找出主要特征向量进行数据投影，从而降低数据的维度。文中还给出了PCA算法的具体计算步骤和示例。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

散布矩阵（scatter matrix）是用于描述多元数据集合中各个变量之间关系的一种矩阵。在统计学和机器学习中，散布矩阵通常用于分析数据的方差、协方差和相关性等特征。

给定一个包含 $n$ 个观测值的多元数据集合，其中每个观测值包含 $d$ 个变量（或特征），则该多元数据集合的散布矩阵是一个 $d\times d$ 的矩阵，其中每个元素表示相应变量之间的协方差。设 $X$ 是一个 $n\times d$ 的数据矩阵，其中每一行表示一个观测值，每一列表示一个变量，则该多元数据集合的散布矩阵 $S$ 可以表示为：

$\frac{1}{n-1}\sum_{i=1}^{n}(x_i-\bar{x})(x_i-\bar{x})^T$

其中， $\bar{x}$ 是数据矩阵 $X$ 每一列的均值向量， $x_i$ 是数据矩阵 $X$ 的第 $i$ 行向量， $^T$ 表示向量的转置操作。

散布矩阵可以用于计算多元数据集合的协方差矩阵和相关矩阵等统计量，进而进行数据分析和机器学习模型的建立和评估。

散布矩阵的计算

给定一个包含 $n$ 个二维坐标的数据集合，其中每个坐标记为 $x_i, y_i)$ ，则该数据集合的散布矩阵可以按照如下步骤计算：

计算每个坐标的均值向量 $\bar{x} = \begin{pmatrix} \bar{x}_1 \ \bar{x}_2 \end{pmatrix}$ ，其中 $\bar{x}_1$ 和 $\bar{x}_2$ 分别表示所有 $x$ 坐标和所有 $y$ 坐标的平均值。

构造 $2\times 2$ 的零矩阵 $\begin{pmatrix} 0 & 0 \ 0 & 0 \end{pmatrix}$ ，作为散布矩阵的初始值。

对于每个坐标 $x_i, y_i)$

最低0.47元/天解锁文章

博客等级

码龄6年

12
原创

53
点赞

33
收藏

17
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: 拉普拉斯性质1的证明方法

下一篇：: 【WGAN-GP】

最新评论

拉普拉斯性质1的证明方法
优快云-Ada助手: 非常感谢您分享这篇关于拉普拉斯矩阵性质1的证明方法的博客，您的研究成果必将对相关领域的学术研究产生积极影响。同时，我想鼓励您继续保持创作热情，坚持不懈地探索更多有意义的主题，并在未来的作品中继续分享您的见解和经验。期待您的下一篇博客！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.youkuaiyun.com/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
【HIT】-CSAPP-大作业-程序人生-Hello‘s P2P
优快云-Ada助手: 恭喜您成功完成第四篇博客，标题看起来十分精彩！我相信您在这篇文章中一定分享了不少有趣的内容。接下来，我想建议您更多地探索与CSAPP相关的主题，或者分享一些与程序人生相关的心得体会。期待您的下一篇作品！优快云会根据你创作的前四篇博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.youkuaiyun.com/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply4 看奖励名单。
数据结构课程小作业（1）【20220908】（自用）
优快云-Ada助手: 不知道算法技能树是否可以帮到你：https://edu.youkuaiyun.com/skill/algorithm?utm_source=AI_act_algorithm

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。