
数据挖掘
bityourtail
爱思考,爱睡觉,爱玩,爱闹
展开
-
Clustering by fast search and find of density peaks
近期要研究聚类算法,便把sci14年的那篇找了出来,实现了一遍,并且进行了优缺点的总结和改进。附代码,详细叙述如下。 sci14年发表的聚类算法是一篇经典的算法,它的主要思想是:在聚类中,类中心往往是密度较大,而且离其他类中心较远的点。先通过找到类中心,再将其他点归并到最近的类中心即可。 它寻找类中心主要是求两个值:密度阈值rou和中心点的距离deta,求得方法可根据论文提示中来。求出那两个参原创 2017-02-05 15:45:46 · 815 阅读 · 1 评论 -
聚类算法中的实验部分
聚类算法中的实验部分最近到了论文的收尾部分,要开始做实验。 起初以为实验部分最简单了,就拿着数据跑一跑,记录结果,画图。直到自己真的做了,才发现里面要注意的特别多,根本不是一间容易事。 我们做实验一般分为两种:人工数据集和现实数据集。现实数据集怎么弄,自己找呗。起初老师让我们找数据,既要数据量大的,又要维数高的。搜索很久,才找到一个免费的数据集网址。http://archive.ics.uci.原创 2017-02-07 22:00:41 · 1368 阅读 · 3 评论