用于可视化中心性的各向异性径向布局
1. 中心性与深度
在许多领域中,都需要衡量和量化群体中个体实体的重要性。在图分析中,中心性指标可以解决这一需求,它通常是图节点上的实值函数。不同的中心性定义侧重点可能不同,但都只依赖于图的结构,而非节点相关的参数。本文示例使用介数中心性,因为它与数据集相关。
节点 $v \in G$ 的介数中心性定义为整个图 $G$ 中经过该节点的最短路径的百分比(或数量)。除了多测地线的情况,介数中心性是图上顶点深度这一更一般概念的特例,它是数据深度在图顶点上的推广。
数据深度是描述性统计中的一类方法,旨在量化集合数据的中心性概念,而无需对基础分布做任何假设。数据深度方法常依赖于凸集形成的带以及点位于随机选择带内的概率。将带深度扩展到图上,通过考虑节点集形成的带,而非仅考虑节点对之间的最短路径,推广了介数中心性,并允许图节点上有非均匀概率分布。
除了图,数据深度方法还被提出用于其他数据类型,如欧几里得空间中的点、函数和曲线。尽管它们的公式不同,但数据深度方法期望具有一些共同的理想属性,如在几何中心处取最大值、在无穷远处为零、径向单调性,这使得数据深度成为集合可视化方法的有吸引力的基础。
2. 应力与多维尺度分析(MDS)
本文提出的方法基于对 MDS 目标函数的修改,因此先简要介绍 MDS。MDS 是一类帮助可视化数据集中成员之间相似性(或不相似性)的方法。多年来,MDS 一直是一系列图绘制算法的基础,旨在实现图理论距离和节点欧几里得距离之间的等距。这里考虑带距离缩放的度量 MDS。
在图绘制中,给定基于图理论距离的距离矩阵,目标是找到节点位置 $X = {\bar{x}
超级会员免费看
订阅专栏 解锁全文
12

被折叠的 条评论
为什么被折叠?



