分类:有监督;聚类:无监督;
1.k-means:连续型,数值型数据,使用欧式距离(余弦距离)“大哥-小弟”的例子,无监督学习算法;形心均值是相加再除即可;对异常值敏感
--k-medoids:形心均值改为中心点,在每个聚簇中按照顺序依次选取点,计算该点到当前聚簇中所有点距离之和,最终距离之和最小的点,则视为新的中心点。计算量比上一个大。
2.k-modes;只是处理分类变量数据;使用汉明距离:不同属性值的个数, 差异度越小,则表示距离越小
3.fuzzy k-modes;模糊;1999年论文有;
4.k-prototypes;基于原型,含有数值型数据也含有分类数据,一种能同时处理两种不同类型数据的聚类方法;时间复杂度比较高;
5.w-k-means;基于权重的k-means算法;