
K-means
文章平均质量分 67
海滩上的那乌克丽丽
I can because i believe i can.
展开
-
K近邻算法(KNN)&&K-means聚类算法
1.思想:初始随机给定K(超参数)个簇中心,这K个簇中心是在样本点中随机选择。按照最邻近原则把待分类的样本点分到各个簇。划分完成后按平均法重新计算各个簇的质心,从而在确定新的簇心。一直迭代,直到簇心的移动距离小于某个给定的值。2.k-means算法评价准则:误差平方和准则,误差平方和达到最优(小)时,可以使类内尽可能紧凑,聚类之间尽可能分开。loss损失:是一个非凸函数,所以有许多最小值,不一定每次都能落到全局最优,有可能落到局部最优。k:簇的个数Ci:某个簇原创 2022-03-11 08:40:03 · 4814 阅读 · 0 评论 -
聚类算法介绍(欧氏距离和余弦距离)
1.聚类就是将数据集划分为若干相似对象组成的多个组或簇的过程,使得同一个组或簇相似度最大化,不同簇间相似度最小化。(有时候聚类可以评价相似性)2.聚类的本质是分组,属于无监督机器学习。3.在聚类分析中,样本之间相似性通常采用样本之间的距离来表示,距离越大表示两个样本越不相似,差异性越大。距离越小,样本差异性越大,距离为零表示两个样本完全一样,无差异。4.连续型数值计量方法最常用的是欧氏距离(l2范数,两点之间直线距离)曼哈顿距离(l1范数,两点之间台阶式距离)5.如果数据是.原创 2022-03-10 19:02:02 · 10041 阅读 · 0 评论