本文取自:
-
Clustering与Classification
Classification(分类)是supervised learning问题,需要事先告知结果,并需要经过训练集的学习;
Clustering(聚类)是unsupervised learning问题,只需要知道如何计算相似度就可以,不需要使用训练数据进行学习。
-
K-Means前提假设
对于每一个 cluster ,我们可以选出一个中心点 (center) ,使得该 cluster 中的所有的点到该中心点的距离小于到其他 cluster 的中心的距离。
-
K-Means目标函数
设我们一共有 N 个数据点需要分为 K 个 cluster ,k-means 要做的就是最小化
J = ∑ n = 1 N ∑ k = 1 K r n k ∣ ∣ x n − μ k ∣ ∣ 2 J=\sum^N_{n=1}\sum^K_{k=1}r_{nk}||x_n-\mu_k||^2 J=

最低0.47元/天 解锁文章
2万+





