47、流式聚类算法:探索与分析

流式聚类算法:探索与分析

1. DEN与CLU足迹对比

DEN留下的足迹呈现出独特的特征。图中展示了DEN为100个微簇留下的次要足迹轨迹,以及与宏簇中心结合的可视化表示。CLU和DEN的足迹看起来相似,都暗示神秘输入数据包含11个簇。DEN在图中的结果尤其吸引人,100个足迹似乎本身就形成了簇。然而,在实际情况中,我们仍对不同“动物”(数据簇)的数量、空间位置、大小和异常情况存疑。我们不禁思考,DEN足迹是否比PrS或CLU足迹“更好”,如果是,又体现在哪些方面呢?

Hahsler等人(2017)的论文全面回顾了MOA在流式聚类中的应用。该论文不仅给出了CLU和DEN的详细示例,还介绍了另外五种流式聚类算法:Clustree、sample、window、DStream和DBStream,并提供了足够的R代码片段,方便有兴趣的人进行实验。论文中对这些算法在静态聚类中的应用进行了比较,还给出了一些流式数据的示例,同时讨论了如何将异常检测与流式算法结合,并展示了相关示例。此外,还介绍了一些事后质量指标,可用于比较不同方法的各个方面。Bifet等人(2018)的研究也是这方面的优质资料。值得一提的是,这些算法的实现可在MOA(大规模在线算法)网站获取,MOA是一个开源软件,允许用户对各种机器学习或数据挖掘算法在流式数据上进行实验。

不过,像BIRCH、CLU、DEN等“流式聚类”算法,既用于静态聚类,又通过离线静态聚类从微簇参数计算宏簇,这表明它们并非完全专注于分析无法批量保留的无标签流式数据。它们都无法独立于事后验证对数据流进行可视化解释,且都需要对计算出的微簇和宏簇进行某种转换才能使足迹可见。那么,基于模型的算法会有所不同,甚至更好吗?接下来我们将一探究竟。

基于模拟退火的计算器 在线运行 访问run.bcjh.xyz。 先展示下效果 https://pan.quark.cn/s/cc95c98c3760 参见此仓库。 使用方法(本地安装包) 前往Releases · hjenryin/BCJH-Metropolis下载最新 ,解压后输入游戏内校验码即可使用。 配置厨具 已在2.0.0弃用。 直接使用白菜菊花代码,保留高级厨具,新手池厨具可变。 更改迭代次数 如有需要,可以更改 中39行的数字来设置迭代次数。 本地编译 如果在windows平台,需要使用MSBuild编译,并将 改为ANSI编码。 如有条件,强烈建议这种本地运行(运行可加速、可多次重复)。 在 下运行 ,是游戏中的白菜菊花校验码。 编译、运行: - 在根目录新建 文件夹并 至build - - 使用 (linux) 或 (windows) 运行。 最后在命令行就可以得到输出结果了! (注意顺序)(得到厨师-技法,表示对应新手池厨具) 注:linux下不支持多任务选择 云端编译已在2.0.0弃用。 局限性 已知的问题: - 无法得到最优解! 只能得到一个比较好的解,有助于开阔思路。 - 无法选择菜品数量(默认拉满)。 可能有一定门槛。 (这可能有助于防止这类辅助工具的滥用导致分数膨胀? )(你问我为什么不用其他语言写? python一个晚上就写好了,结果因为有涉及json读写很多类型没法推断,jit用不了,算这个太慢了,所以就用c++写了) 工作原理 采用两层模拟退火来最大化总能量。 第一层为三个厨师,其能量用第二层模拟退火来估计。 也就是说,这套方法理论上也能算厨神(只要能够在非常快的时间内,算出一个厨神面板的得分),但是加上厨神的食材限制工作量有点大……以后再说吧。 (...
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值