前言
在前文流聚类之DenStream中介绍了算法DenStream的工作流程,本文的算法是在该算法上作出的优化改进,本文简单介绍其优化手段。
一、算法优化策略
提出了一种新的剪枝策略,以往的基于密度的数据流聚类的算法都是通过检测o微簇的权重是否低于阈值或者p微簇是否长时间没有数据点的加入导致微簇的权重降低;
该算法通过计算每一类微簇等待数据点的时间,如果微簇平均等待一个新的数据点的时间超过该簇数据点的平均到达时间,就将其删除;
在前文流聚类之DenStream中介绍了算法DenStream的工作流程,本文的算法是在该算法上作出的优化改进,本文简单介绍其优化手段。
提出了一种新的剪枝策略,以往的基于密度的数据流聚类的算法都是通过检测o微簇的权重是否低于阈值或者p微簇是否长时间没有数据点的加入导致微簇的权重降低;
该算法通过计算每一类微簇等待数据点的时间,如果微簇平均等待一个新的数据点的时间超过该簇数据点的平均到达时间,就将其删除;