
聚类算法
文章平均质量分 80
qq_36134318
这个作者很懒,什么都没留下…
展开
-
二分的kmeans、Kmeans++、
一.二分KMeans: 算法的主要思想是:首先将所有点作为一个簇,然后将该簇一分为二。之后选择能最大限度降低聚类代价函数(也就是误差平方和)的簇划分为两个簇。以此进行下去,直到簇的数目等于用户给定的数目k为止。以上隐含的一个原则就是:因为聚类的误差平方和能够衡量聚类性能,该值越小表示数据点越接近于他们的质心,聚类效果就越好。所以我们就需要对误差平方和最大的簇进行再一次划分,因...原创 2018-05-24 20:05:09 · 4578 阅读 · 0 评论 -
聚类算法-kmeans
K-means(k均值)算法 k-means是划分方法中较经典的聚类算法之一。由于该算法的效率高,所以在对大规模数据进行聚类时被广泛应用。目前,许多算法均围绕着该算法进行扩展和改进。 k-means算法以k为参数,把n个样本分成k个簇,使簇内具有较高的相似度,而簇间的相似度较低。k-means算法的处理过程如下:首先,随机地 选择k个样本,每个样本初始地代表了一个簇的平均值或中心;对剩余的...转载 2018-05-22 17:30:52 · 1282 阅读 · 0 评论 -
机器学习中的距离公式
1. 欧氏距离,最常见的两点之间或多点之间的距离表示法,又称之为欧几里得度量,它定义于欧几里得空间中,如点 x = (x1,...,xn) 和 y = (y1,...,yn) 之间的距离为:(1)二维平面上两点a(x1,y1)与b(x2,y2)间的欧氏距离:(2)三维空间两点a(x1,y1,z1)与b(x2,y2,z2)间的欧氏距离:(3)两个n维向量a(x11,x12,…,x1n)与 b(x21...转载 2018-05-22 15:52:29 · 2170 阅读 · 0 评论 -
聚类算法1-距离表示和评价指标
1.可以实现聚类的算法大概有这么多:K-means系列的:K-means,K-means++,K_means||,canopy,mini Batch K-means密度聚类:层次聚类:谱聚类:2.相似度/距离表示: 2.1 闵可夫斯基距离 两个n维变量a(x11,x12,…,x1n)与 b(x21,x22,…,x2n)间的闵可夫斯基距离定义为: 其中p是一个变参数。当p=1时,就是曼哈顿距离两个n...原创 2018-05-22 15:49:52 · 1669 阅读 · 0 评论