【转载】有规模限制的聚类算法Python轮子

本文介绍了在有规模限制的情况下进行聚类的Python实现,包括等大聚类和最小最大规模限制的聚类算法,如Fuzzy C-means、启发式KMeans等。这些方法适用于员工任务分配、前置仓选取、路径规划等应用场景,解决组合优化问题。文章提供了Github和PyPI的项目链接,以及多个示例来展示算法效果。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

背景介绍

机器学习的聚类算法在很多场景中都有应用,比如用户群体的聚类,地址聚类等。但是,在实际问题中,我们的聚类问题常常是有类的规模限制的,比如我们需要创建几个等大的类,或者有最小类大小的限制等。

虽然在很多学习算法和初入机器学习的同学们看来,聚类相关算法是机器学习中无监督学习中常见的一种,但从另一个角度看,聚类其实是求解一个组合优化问题,属于NP-hard问题。

应用场景

  • 员工/外卖员等任务分配:我们给员工分配具体的工作区域或者工作任务量。因为我们分配对象的任务是人,所以我们需要考虑人性,考虑任务量的公平。因此,可以考虑等大聚类获得不同的等大类的区域结果分配给员工。当然,我们考虑员工的能力差异,也可以考虑按能力比例进行区域的聚类。
  • 前置仓的选取:我们知道电商的前置仓是要选取离消费者近的地方的,能够提高实效,提升服务质量。但是前置仓选取太多,或者面向消费者的需求点太少,这样会导致仓的成本太高。因此,有的时候是基于消费者需求空间分布进行聚类选点。从这个角度来说,我们可以考虑最小最大限制的聚类方式进行初步选点。
  • 路径规划:路径规划中有一种启发式算法是Cluster-first-Route-second。我们要考虑同种车型的可服务的需求点是有限的,且一致的,所以在做Cluster的时候考虑有空间规模限制的聚类。
  • 选址规划:类比路径规划,我们在做门店选址/工厂选址等问题的时候,也得考虑空间聚类问题选取候选点,也可以缩小问题求解的规模。
  • 其它在生物/化学/工程实际问题中的一些应用。

Size Constrained Clustering轮子介绍

Github地址:

https://github.com/jingw2/size_constrained_clustering​github.com/jingw2/size_constrained_clustering

PyPI地址:

https://pypi.org/project/size-constrained-clus

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值