空间聚类算法与伊斯兰文本语义表示研究
1. 空间聚类算法研究
1.1 动态与静态 K-means 对比测试
为了比较动态 K-means(K-meansdDyn1 和 K-meansdDyn2)与静态 K-means 的性能,进行了多项测试。所有测试版本的 K-means 迭代次数均设为 100。由于这是无监督基准测试,为比较三种 K-means 版本的结果,对基准的非空间属性执行经典 K-means(k = 3),以更好地可视化对象分布及其含义。此外,对空间属性执行 K-meansdDyn2(α = 0),得到区域划分结果。
|颜色|区域含义(图 2)|区域含义(图 3)|
| ---- | ---- | ---- |
|蓝色|北部地区|富裕社区|
|黄色|中部地区|中产阶级社区|
|红色|南部地区|贫困社区|
1.2 K-means 不同版本比较
对 K-meansstatic(KNN 邻居数为 2 和 4)、K-meansdDyn1 和 K-meansdDyn2(α = β = 0.5)进行可视化测试,K-means 的类别数设为 3。
- KNN 参数对聚类的影响 :当邻居数为 2 时,有一定数量的对象(红色类和黄色类之间的对象)被归为“贫困社区”簇;当构建平滑矩阵时考虑更多邻居,该数量减少。部分在图 4 中被分类到蓝色簇的对象,在图 5 中被分类到红色簇。
- 不同版本聚类结果比较 :经典 K-means 和 K-meansstatic(图 5)的分类结果相近,空间属性对聚类的影响不明显。K-mea
超级会员免费看
订阅专栏 解锁全文
13

被折叠的 条评论
为什么被折叠?



