一、算法简介
一趟聚类算法是由蒋盛益教授提出的无监督聚类算法,该算法具有高效、简单的特点。数据集只需要遍历一遍即可完成聚类。算法对超球状分布的数据有良好的识别,对凸型数据分布识别较差。一趟聚类可以在大规模数据,或者二次聚类中,或者聚类与其他算法结合的情况下,发挥其高效、简单的特点;
算法流程:
1. 初始时从数据集读入一个新的对象
2. 以这个对象构建一个新的簇
3. 若达到数据集末尾,则转6,否则读入一个新的对象;计算它与每个已有簇之间的距离,并选择与它距离最小的簇。
4. 若最小距离超过给定的阈值r,转2
5. 否则将对象并入该簇,并更新簇心,转3
6. 结束
在本算法中,采用的是欧式距离公式计算节点与簇心之间的距离
欧式距离公式: