
机器学习
文章平均质量分 74
KDF5000
热爱互联网热爱IT
展开
-
k-means聚类算法
k-means聚类算法 优点: 容易实现 缺点: 可能收敛到局部最小值,在大规模数据集上收敛较慢 使用数据类型: 数值型护具 k-均值是发现给定数据集的k个簇的算法.k有用户决定.每一个簇通过旗质心,即簇中所有点的中心描述. 工作流程: 首先随机确定k个初始点作为其质心.然后讲护具集中的每个点分配到一个簇中,也就是分配到距其最近的质心对应的簇.这一步完成时后,每个簇的质心更新为该簇原创 2015-11-07 23:22:56 · 1639 阅读 · 0 评论 -
二分k-均值算法
前面介绍过k-means聚类算法,通过不断的更新簇质心直到收敛为止,但是这个收敛是局部收敛到了最小值,并没有考虑全局的最小值.那么一个聚类算法怎么才能称得上效果好呢?要想评价一个算法的好坏,首先需要有一个标准,这也是我们设计算法的时候要首先考虑的,我们设计算法的目的是什么,设计的算法要达到的什么效果,这样才能明确设计算法的目标.一种度量聚类算法效果的指标是SSE(Sum of Squard Erro原创 2015-11-11 18:54:02 · 5887 阅读 · 1 评论