
社区检测
spcoder
努力成为一名合格的程序猿
展开
-
分类与聚类的区别以及聚类的方法分类
分类与聚类的区别对于分类来说,在对数据集分类时,我们是知道这个数据集是有多少种类的。根据给定的数据集,训练出一个模式或者规则,对新来的数据进行类别判断。我们可以将分类看作是有监督的学习。对于聚类来说,在对数据集操作时,我们是不知道该数据集包含多少类,我们要做的,是将数据集中相似的数据归纳在一起。比如对社交媒体中的人进行聚类,在聚类之前我们并不知道有多少个类别,我们可以通过他们之间的某一标准来度...原创 2019-06-13 09:41:54 · 2586 阅读 · 0 评论 -
Jaccard系数
Jaccard相似系数Jaccard相似系数(Jaccard similarity coefficient)用于比较有限样本集之间的相似性与差异性。Jaccard系数值越大,样本相似度越高。定义:给定两个集合A,B,Jaccard系数定义为A与B的交集大小与A与B并集大小的比值,具体如下:当集合A,B全部为空时,J(A,B)= 1。与Jaccard系数相关的指标是Jaccard距离,用于...转载 2019-06-13 09:56:26 · 3425 阅读 · 0 评论 -
超图(Hypergraph)概念理解
这几天在看关于复杂网络的paper,其中有一个概念叫做HyperGraph,中文名译为“超图”。这个概念paper上面讲的不是很清楚,于是我去查了一下维基:In mathematics, a hypergraph is a generalization of a graph in which an edge can join any number of vertices. Formally, a...转载 2019-06-06 19:26:21 · 26790 阅读 · 6 评论