仿真救援和K-Means优化

本文探讨了K-Means聚类算法的改进方案,包括如何选择合适的K值和初始聚类中心,以及何时停止迭代。通过引入Canopy聚类算法作为预处理步骤,实现了更有效的K值确定及初始中心选择。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

本文记录这段时间对仿真救援的新的认识和想法,多来源于南邮硕士论文,油管上一些up主的教学视频~
1.manual中 对于ChangedSet的定义:The set of currently visible entities for an agent are stored in a structure named ChangeSet; entities present in it are automatically updated in its world model.一个智能体现所能看到的实体存放在一个称作ChangeSet的数据结构中,这些实体会自动得更新到 world model 中。
2.移动方向的规定: The Y-axis positive half is zero, and the value increases until 360*60*60-1 seconds anti-clockwise。(注意1度=3600秒(second),以y轴正向为0度,逆时针为+)

关于K-Means的一些改进

首先聚类是有效果好坏之分的,直观上是抱团紧不紧,异族远不远,学术上叫做类间距高,类间距低,比较影响效果的因素我总结有下面几条我们可以做文章:
1.K的选定。
2.初始聚类中心的选定。
3.迭代到什么时候停止。

K的选定&初始聚类中心的选定

谈具体方法前先介绍一个新的算法canopy聚类算法:
算法需要的参数和数据结构:
1.两个距离阈值T1,T2 (T1>T2)
2.一个初始时存放了所有结点的表 points,它存在的意义在于让点独立成canopy,每独立一个就删除一个点
3.一个目的为存放所有canopy的表 canopies
4.canopy为一群点的集合,一个点可以同时存在于多个canopy当中
基本思想:
canopy聚类的结果一般用于其他聚类的初始,我们不关心多个canopy之间是否有重叠,而只关注在重叠可接受的范围内(类间距离不要太小)时应该分成几个聚类,用于K-Means算法中K值得确定和初始中心的确定。
简单实现代码将在末尾放出。

接下来介绍两个用上canopy的方法:
1)基本步骤:
(1)从结点表开始,随机选取一个点创建一个canopy并从points表中删除该点。

(2)对points进行迭代,while(points不为空)
{ 如果一个点距离canopy的center的距离小于T2则说明它离一个canopy非常近以至于不会独立成一个canopy,随即从points删除它,若小于T1则说明它离一个canopy比较近但仍随着center的移动,它有可能独立成canopy, 若距离现有的所有canopy的距离都大于T2则它应独立成canopy }
最终的表canopies的大小就是K-Means算法需要的K值,各个canopy的center就是K-Means初始分区的center。
方法二:防止canopies初始聚类后entities在地图仍过于零散我们对K值得选定和“最远距离原则”对中心的选定进行进一步的优化。
K也可以由健康智能体(buriedness == 0&&damage == 0)的数量决定的,如下图所示
这里写图片描述

Nmp表示最大分区数目,Num表示健康消防智能体的数目,Ce表示饱和系数,由每个地图的初始化参数的不同

假定在Canopy算法结束后生成了M个canopy,但根据上述公式我们可能最终只需要K( K < M )个初始族群,这时用最远距离原则来确定这K个簇初始center:
随机选择一个Canopy簇,该簇的中心为c1,然后选择离c1最远的Canopy簇c2,选择距离c1、c2最远的Canopy簇c3,以此类推,最终从M个Canopy簇中选择k个簇中心得到K-Means初始簇中心c1,c2,…,ck。

迭代停止

SampleKMeans.java中for (int i = 0; i < repeat; i++)语句表明只是简单地在事先给定的次数内不断聚类,但实际上可以加个条件。由于K-Means聚类算法是收敛的,当各个聚类的中心移动在可接受范围内时可以近似认为不再变化。步骤也很简单,用两个表装载两次的中心,每次大循环结束前对前后中心求距离,并找出距离最大值判断是否在接受范围内。

资源下载链接为: https://pan.quark.cn/s/140386800631 通用大模型文本分类实践的基本原理是,借助大模型自身较强的理解推理能力,在使用时需在prompt中明确分类任务目标,并详细解释每个类目概念,尤其要突出类目间的差别。 结合in-context learning思想,有效的prompt应包含分类任务介绍及细节、类目概念解释、每个类目对应的例子待分类文本。但实际应用中,类目样本较多易导致prompt过长,影响大模型推理效果,因此可先通过向量检索缩小范围,再由大模型做最终决策。 具体方案为:离线时提前配置好每个类目的概念及对应样本;在线时先对给定query进行向量召回,再将召回结果交给大模型决策。 该方法不更新任何模型参数,直接使用开源模型参数。其架构参考GPT-RE并结合相关实践改写,加入上下文学习以提高准确度,还使用BGE作为向量模型,K-BERT提取文本关键词,拼接召回的相似例子作为上下文输入大模型。 代码实现上,大模型用Qwen2-7B-Instruct,Embedding采用bge-base-zh-v1.5,向量库选择milvus。分类主函数的作用是在向量库中召回相似案例,拼接prompt后输入大模型。 结果方面,使用ICL时accuracy达0.94,比bert文本分类的0.98低0.04,错误类别6个,处理时添加“家居”类别,影响不大;不使用ICL时accuracy为0.88,错误58项,可能与未修改prompt有关。 优点是无需训练即可有较好结果,例子优质、类目界限清晰时效果更佳,适合围绕通用大模型api打造工具;缺点是上限不高,仅针对一个分类任务部署大模型不划算,推理速度慢,icl的token使用多,用收费api会有额外开销。 后续可优化的点是利用key-bert提取的关键词,因为核心词语有时比语意更重要。 参考资料包括
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值