典型变量分析及相关方法解读
1. 数据可视化建议
在数据可视化方面,通常建议采用二维图,并辅以用平行坐标在单独的线上表示其他维度的点。这种方式有助于更全面地展示数据的特征。
2. 典型(或特征)轮廓
- 定义与术语 :形如 $\lambda_1U_1^ , \cdots, \lambda_kU_k^ , \cdots$ 的 $p$ 维向量,在不同文献中有不同的称呼,如典型轮廓(Rao, 1964)、基本模式(Holter 等,2000)以及工程文献中的特征轮廓。
- 信息近似 :通过构造可知,由前几个这样的向量计算得到的离散矩阵(2.13)能很好地近似从整个原始测量集得到的离散矩阵(2.14)。使用前 $k$ 个典型轮廓时信息损失的度量为 $\frac{\lambda_{k + 1}^2 + \cdots + \lambda_p^2}{\lambda_1^2 + \cdots + \lambda_p^2}$,通常以百分比表示。
- 拟合评估 :用前 $k$ 个典型轮廓对 $X_c = (X - \xi1’)$ 进行最佳拟合为 $\hat{X} c = \lambda_1U_1^ U_1^{ \prime} + \cdots + \lambda_kU_k^ U_k^{ \prime}$,$X_c - \hat{X}_c$ 表示偏差量。第 $i$ 个轮廓拟合不足的总体度量是矩阵 $ (X_c - \hat{X}_c)^\prime M (X_c
超级会员免费看
订阅专栏 解锁全文
2万+

被折叠的 条评论
为什么被折叠?



