
聚类
Cuzur
这个作者很懒,什么都没留下…
展开
-
关于文本的Brich层次聚类
1.文本聚类的一般性过程:一般生成文档向量矩阵的格式是,每一行代表一个文档,每一列是一个维度代表该文档这个词的权重,没出现这个词就是0,几千个文件维度在10多w左右(看文档的大小),这么大的维度人脑想也想到了,矩阵将是及其稀疏的,也就是说,在一个高维空间中,几千个点几乎都聚在了一起,虽说彼此之间有距离,但是距离非常之小,很明显这样聚类效果肯定非常差,实测过,跟抛硬币的概率一样。于是将矩阵稠密一...转载 2019-03-17 22:21:27 · 2757 阅读 · 0 评论 -
K-Means聚类算法的实现
前言 本文为我的期末大作业,知识原理参考了他人的文章,并不全是我的想法,有不足之处请指出 。K-均值聚类算法的原理与实现一K-均值聚类算法的原理1.1聚类介绍聚类是一种无监督的学习,它将相似的对象归到同一个簇中,聚类方法几乎可以应用于所有对象,簇内的对象越相似,聚类的效果越好,在现实中我们用到很多的簇的类型,使用不同的簇类型划分数据的结果是不同的,如...原创 2018-07-11 20:47:15 · 2013 阅读 · 1 评论