无监督学习 | KMeans与KMeans++原理

X1AO___X1A

于 2019-09-08 00:10:10 发布

阅读量2k

点赞数 3

分类专栏：无监督学习 # 聚类算法文章标签：机器学习无监督学习聚类算法 KMeans++

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_45488228/article/details/100612021

版权

文章目录

1. 原型聚类
2. 在线可视化 KMeans
参考资料

相关文章：

机器学习 | 目录

机器学习 | 聚类评估指标

机器学习 | 距离计算

无监督学习 | KMeans之Sklearn实现：电影评分聚类

无监督学习 | 层次聚类之凝聚聚类原理及Sklearn实现

无监督学习 | DBSCAN 原理及Sklearn实现

无监督学习 | GMM 高斯混合聚类原理及Sklearn实现

1. 原型聚类

原型聚类亦称“基于原型的聚类”（prototypr-based clustering）。此类算法假设聚类结构能通过一组原型刻画，在现实聚类任务重及其常用。通常情形下，算法先对原型进行初始化，然后对原型进行迭代更新求解。采用不同的原型表示、不同的求解方式，将产生不同的算法，如 KMeans、LVQ、高斯混合。下面介绍 KMeans 算法，我们将在下一篇文章中介绍高斯混合算法。

“原型”是指样本空间具有代表性的点

1.1 KMeans

给定样本集 $D={x_1,x_2,\cdots,x_m}$ ，“$k$ 均值”（k-means）算法针对聚类所得簇划分 $C={C_1,C_2,\cdots,C_k}$ 最小化平方误差（残差平方和 $S_E$ ）：

$E=\sum_{i=1}^k \sum_{x\in C_i}\|x-\mu_i\|_2^2 \tag{1}$

其中 $\mu_i=\frac{1}{|C_i|}\sum_{x\in C_i}x$

最低0.47元/天解锁文章

博客等级

码龄6年

43
原创

144
点赞

694
收藏

68
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: 机器学习 | 距离计算

下一篇：: 无监督学习 | KMeans之Sklearn实现：电影评分聚类

最新评论

PyPDF2 | 利用 Python 实现 PDF 分割
qq_64831425: from PyPDF2 import PdfReader, PdfWriter infile = r"" outfile = r"" pdf_input_left = PdfReader(open(infile, 'rb')) pdf_input_right = PdfReader(open(infile, 'rb')) pdf_output = PdfWriter() page = pdf_input_left.pages[0] width = page.mediabox.width height = page.mediabox.height page_count = len(pdf_input_left.pages) for i in range(page_count): # left page page_left = pdf_input_left.pages[0] page_left.mediabox.lower_left = (0, 0) page_left.mediabox.lower_right = (width/2, 0) page_left.mediabox.upper_left = (0, height) page_left.mediabox.upper_right = (width/2, height) pdf_output.add_page(page_left) # right page page_right = pdf_input_right.pages[0] page_right.mediabox.lower_left = (width/2, 0) page_right.mediabox.lower_right = (width, 0) page_right.mediabox.upper_left = (width/2, height) page_right.mediabox.upper_right = (width, height) pdf_output.add_page(page_right) pdf_output.write(open(outfile, 'wb')) 最新版的
无监督学习 | 层次聚类之凝聚聚类原理及Sklearn实现
SZX0311: 离差平方和公式明白，我看了原文，文中xi是一个得分，但是这里算距离时，ess公式中的xi是什么？
无监督学习 | KMeans之Sklearn实现：电影评分聚类
布娜呐:
SQLite | 数据库设计与 Creat Table 语句
学无止境勤且思: 外键可以嵌套么？比如A表K1作为B表P2的外键，B表P2作为C表T3的外键，报错：“create table failed.unknown column "BU_Data" in foreign key definition”
SQLite | SQLite 与 Pandas 比较篇之一
sleeping_dogs: 性能差距如何，据说sqlite远超pandas

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。