多元统计与方向数据统计分析
1. 多元统计中的矩阵计算
在多元统计分析里,我们会计算混合矩阵 (A) 和分离矩阵 (W),计算公式如下:
[A_{ICA} = A_{PCA} * B]
[W_{ICA} = B’ * W_{PCA}]
其中,混合矩阵 (A) 可用于估算测量中分离信号的比例,其元素 (a_{ij}) 对应主成分载荷。在 MATLAB 中,有 FastICA 包可供使用,可从 http://www.cis.hut.fi/projects/ica/fastica/ 找到。
2. 聚类分析
聚类分析旨在将彼此相似的对象分组,相较于其他单个对象或对象组,这些组内对象更为相似。其主要步骤如下:
1. 计算对象间相似度 :有多种方法可计算两个数据向量间的相似度,常见的有:
- 欧几里得距离 :这是多元空间中描述两个测量值的两点间的最短距离,是最直观的相似度度量方法。
- 曼哈顿距离 :类似于在曼哈顿城市中,需沿垂直街道行走而非对角线穿过街区,该距离是所有差值的总和。
- 相关相似度系数 :使用皮尔逊线性积矩相关系数计算两个对象的相似度,适用于关注对象上测量变量间比例的情况,但该系数对异常值敏感,使用时需谨慎。
- 内积相似度指数 :将数据向量长度归一化为 1
超级会员免费看
订阅专栏 解锁全文
2697

被折叠的 条评论
为什么被折叠?



