K-means算法思想:
1)选择k个点作为初始质心
2)repeat
将每个点指派到最近的质心,形成k个簇
重新计算每个簇的质心
3)utill 簇不发生变化或达到最大迭代次数
重新计算每个簇的质心,如何计算是根据误差评分和(Sum of the Squared Error, SSE)作为聚类的目标函数,两次运行K均值产生的两个不同的簇集,我们选择SSE最小的。
公式1 SSE的计算公式
k表示k个聚类中心,表示第i个中心,dist表示的是欧几里得距离。
1)选择k个点作为初始质心
2)repeat
将每个点指派到最近的质心,形成k个簇
重新计算每个簇的质心
3)utill 簇不发生变化或达到最大迭代次数
重新计算每个簇的质心,如何计算是根据误差评分和(Sum of the Squared Error, SSE)作为聚类的目标函数,两次运行K均值产生的两个不同的簇集,我们选择SSE最小的。
公式1 SSE的计算公式
k表示k个聚类中心,表示第i个中心,dist表示的是欧几里得距离。