原型聚类(prototype-based clustering)
原型聚类,此类算法假设聚类结构能通过一组原型刻画,在现实聚类任务中极为常用,通常情形下,算法先对原型进行初始化,然后对原型进行迭代更新求解,采用不同的原型表示,不同的求解方式,将产生不同的算法,主要有:K均值算法、学习向量量化和高斯混合聚类。
K均值算法
K均值算法,顾名思义,可知将一组数据 D={ x1,x2,...,xm} D = { x 1 , x 2 , . . . , x m } 聚成K类,”均值”是指对聚类所得簇划分 C={ C1,C2,...,Ck} C = { C 1 , C 2 , . . . , C k } 最小化平方误差
E=∑i=1k∑x∈Ci∥x−μi∥22(1.1) (1.1) E = ∑ i = 1 k ∑ x ∈ C i ‖ x − μ i ‖ 2 2
其中 μi=1|

本文介绍了原型聚类中的K均值算法,详细阐述了算法原理,并提供了Python实现的示例,包括如何利用scipy.cluster进行K-means聚类。同时,讨论了K-means算法的优缺点,如需要预设类别数量、对噪声敏感等问题。
最低0.47元/天 解锁文章
5197

被折叠的 条评论
为什么被折叠?



