变量的拓扑聚类方法解析
在数据处理和分析中,对变量进行聚类是一项重要的任务,它有助于我们理解变量之间的关系,将相似的变量归为一类,从而更好地进行数据挖掘和决策。本文将介绍一种新的变量拓扑聚类方法,涵盖不同类型变量的处理方式、聚类过程以及实际案例分析。
1. 参考邻接矩阵构建
根据变量类型的不同,可分为定量变量、定性变量以及两者混合的情况,下面分别介绍不同类型变量的邻接矩阵构建方法。
- 定量变量 :假设有 $p$ 个定量变量 ${x_j; j = 1, \cdots, p}$ 和 $n$ 个个体对象。为了研究变量之间的拓扑相关性,构建邻接矩阵 $V_{u^{\star}}$,它对应于相关矩阵。通过线性相关系数的 $t$ 检验(Bravais–Pearson 相关系数 $\rho$ 的 $t$ 检验)来确定邻接矩阵的值。
- 定义 1.1 :与参考度量 $u^{\star}$ 相关联的参考邻接矩阵 $V_{u^{\star}}$ 定义为:
[
V_{u^{\star}}(x_k, x_l) =
\begin{cases}
1 & \text{如果 } p - \text{值} = P[ | T_{n - 2} | > t - \text{值} ] \leq \alpha ; \forall k, l = 1, p \
0 & \text{否则}
\end{cases}
]
其中,$p$ - 值是对原假设 $H_0 : \rho(x_k, x_l) = 0$ 和备择假设 $H_1 : \rho(x_k, x_
超级会员免费看
订阅专栏 解锁全文
894

被折叠的 条评论
为什么被折叠?



