仿真救援和K-Means优化

最新推荐文章于 2025-06-27 23:27:31 发布

原创最新推荐文章于 2025-06-27 23:27:31 发布 · 479 阅读

4 ·

CC 4.0 BY-SA版权

本文探讨了K-Means聚类算法的改进方案，包括如何选择合适的K值和初始聚类中心，以及何时停止迭代。通过引入Canopy聚类算法作为预处理步骤，实现了更有效的K值确定及初始中心选择。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

本文记录这段时间对仿真救援的新的认识和想法，多来源于南邮硕士论文，油管上一些up主的教学视频~
1.manual中对于ChangedSet的定义：The set of currently visible entities for an agent are stored in a structure named ChangeSet; entities present in it are automatically updated in its world model.一个智能体现所能看到的实体存放在一个称作ChangeSet的数据结构中，这些实体会自动得更新到 world model 中。
2.移动方向的规定: The Y-axis positive half is zero, and the value increases until 360*60*60-1 seconds anti-clockwise。（注意1度=3600秒(second),以y轴正向为0度，逆时针为+）

关于K-Means的一些改进

首先聚类是有效果好坏之分的，直观上是抱团紧不紧，异族远不远，学术上叫做类间距高，类间距低，比较影响效果的因素我总结有下面几条我们可以做文章：
1.K的选定。
2.初始聚类中心的选定。
3.迭代到什么时候停止。

K的选定&初始聚类中心的选定

谈具体方法前先介绍一个新的算法canopy聚类算法：
算法需要的参数和数据结构：
1.两个距离阈值T1,T2 (T1>T2)
2.一个初始时存放了所有结点的表 points，它存在的意义在于让点独立成canopy，每独立一个就删除一个点
3.一个目的为存放所有canopy的表 canopies
4.canopy为一群点的集合，一个点可以同时存在于多个canopy当中
基本思想：
canopy聚类的结果一般用于其他聚类的初始，我们不关心多个canopy之间是否有重叠，而只关注在重叠可接受的范围内(类间距离不要太小)时应该分成几个聚类，用于K-Means算法中K值得确定和初始中心的确定。
简单实现代码将在末尾放出。

接下来介绍两个用上canopy的方法：
1）基本步骤：
（1）从结点表开始，随机选取一个点创建一个canopy并从points表中删除该点。

（2）对points进行迭代，while（points不为空）
{ 如果一个点距离canopy的center的距离小于T2则说明它离一个canopy非常近以至于不会独立成一个canopy，随即从points删除它，若小于T1则说明它离一个canopy比较近但仍随着center的移动，它有可能独立成canopy，若距离现有的所有canopy的距离都大于T2则它应独立成canopy }
最终的表canopies的大小就是K-Means算法需要的K值，各个canopy的center就是K-Means初始分区的center。
方法二：防止canopies初始聚类后entities在地图仍过于零散我们对K值得选定和“最远距离原则”对中心的选定进行进一步的优化。
K也可以由健康智能体(buriedness == 0&&damage == 0)的数量决定的，如下图所示
这里写图片描述

Nmp表示最大分区数目，Num表示健康消防智能体的数目，Ce表示饱和系数，由每个地图的初始化参数的不同

假定在Canopy算法结束后生成了M个canopy，但根据上述公式我们可能最终只需要K（ K < M ）个初始族群，这时用最远距离原则来确定这K个簇初始center:
随机选择一个Canopy簇，该簇的中心为c1，然后选择离c1最远的Canopy簇c2，选择距离c1、c2最远的Canopy簇c3，以此类推，最终从M个Canopy簇中选择k个簇中心得到K-Means初始簇中心c1,c2,…,ck。

迭代停止

SampleKMeans.java中for (int i = 0; i < repeat; i++)语句表明只是简单地在事先给定的次数内不断聚类，但实际上可以加个条件。由于K-Means聚类算法是收敛的，当各个聚类的中心移动在可接受范围内时可以近似认为不再变化。步骤也很简单，用两个表装载两次的中心，每次大循环结束前对前后中心求距离，并找出距离最大值判断是否在接受范围内。