等级分布图的边界元素的处理

本文介绍了聚类分析中的轮廓系数和莫兰指数的概念及其应用。轮廓系数综合考量了簇的凝聚度和分离度,用于评估样本在簇内的适宜性。而莫兰指数则衡量了空间数据的相关性,帮助理解数据的空间分布特性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

  1. 鉴定边界元素

簇的凝聚度和分离度并不是独立的,两者之和为一个常数,等于总平方和, 即每个样本到总均值的距离的平方和,明显,单纯地使用凝聚度或者分离度作为聚类的有效性分析是不严谨的 。

Kaufman等人提出的轮廓系数( SilhouetteCoefficient)结合了凝聚度和分离度 。 

针对数据集里样本d_((i)), 假设样本d_((i)) 被聚类到簇A , 其轮廓系数S_((i))定义如下:
S_((i))=(b_((i) )-a_((i)))/(max⁡{b_((i) ),a_((i))})

      其中,a_((i))=样本d_((i))与其同簇其他样本的平均距离;对于其他非簇A

的簇C而言,令D_((i,C))= 样本d_((i))与簇C中所有样本的平均距离,则

b_((i))=min¦(C≠A) {D_((i,C)) },假设样本与簇B中所有样本的平均距离取得该最小值。

S_((i))取值介于-1和1之间,若S_((i))接近1,则表示簇内平均距离a_((i))远小于簇间平均距离b_((i)),表示该样本适合簇A,反之,若S_((i)) 接近-1,则表示该样本更适合簇B,若S_((i)) 接近0,则表示样本极有可能被重新分类
 

2.空间关联指标

  

轮廓系数并不能指出是否改变这些元素会影响视觉上的空间关联

莫兰指数(Morans I)是用来度量空间相关性的一个重要指标。他是一个有理数,经过方差归一化之后,它的值会被归一化到-1.0--1.0之间。


一般说来,莫兰指数分为全局莫兰指数(GlobalMoransI)和安瑟伦局部莫兰指数(AnselinLocalMoransI前者是是澳大利亚统计学家帕克·莫兰提出的,后者是美国亚利桑那州立大学地理与规划学院院长LucAnselin教授1995年提出
 

Morans I >0表示空间正相关性,其值越大,空间相关性越明显,Moran’s I<0表示空间负相关性,其值越小,空间差异越大,否则,Moran’s I = 0,空间呈随机性


Clustered集群):任何东西与别的东西之间都是相关的,但近处的东西比远处的东西相关性更强  Moran’sI>0

Dispersed(散布数据)不同类在空间上是连续的,Moran’s I<0

Random:随机的,Moran’sI接近0


空间自相关的Moran’sI统计可表示为:




其中,N等于要素总数,W_(i,j)是要素i和j之间的空间权重,∑▒i∑▒〖jW_(i,j) 〗 是所有空间权重的聚合,x ̅是要素x的属性的平均值。


例子:


 

Fig.1. An example of k-means clustering (k=5).Boundaryelementswith a silhouette coefficient from-:1t0arehighlighted. Weannotate one boundaryelementwith a red circle and show therelationship between the two views.



评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值