
数据挖掘
道不知。
我很懒,还没有添加简介
展开
-
PageRank算法c++实现
M=(1-d)*Q+d*A 常量矩阵Q=(qi,j),qi,j=1/n。首先用邻接矩阵A表示从页面j到页面i的概率,然后根据公式生成转移概率矩阵。ei=|Ri+1-Ri|,当ei原创 2023-11-04 16:40:09 · 458 阅读 · 0 评论 -
k-means算法c++实现
计算数据集中的元素与各个簇的中心的距离,将它赋给最近的簇,然后重新计算每个簇的平均值,再将元素按离平均值点最近的原则重新分配直到没有出现重新分配。用这个来标记每个数据在哪个簇中。该算法要事先给出k的值,即划分为几个簇。原创 2023-11-03 19:45:44 · 493 阅读 · 0 评论 -
DBSCAN算法c++实现
再判断这些直接密度可达点里如果有核心点则又将该直接密度可达点放进set subNeighbors,最后neighbors.insert(subNeighbors.begin(), subNeighbors.end());首先计算出距离每个点e以内的点,如果个数>=minPts,则找出它的直接密度可达和间接可达的点,用visited标记点是否已经在簇中,循环直到最后一个点。数据集:参考数据挖掘原理与算法第四版DBSCAN例子。原创 2023-10-27 19:09:29 · 831 阅读 · 0 评论 -
DIANA算法c++实现
重复第二步的工作,直到没有新的old party中的点分配给splinter group且满足分裂的簇数k,如果没有到达终止条件,则从分裂好的簇中选一个最大的簇按刚才的分裂方法继续分裂。第二步 在old party里找出到splinter group中点的最近距离原创 2023-10-29 23:03:36 · 397 阅读 · 0 评论 -
AGENS算法c++实现
cluster二维数组存放数据的编号,每次计算两个簇的距离,找出距离最近的,将其中一个簇的编号加入另一个编号的一维序列中,再将这个编号清除,之后再循环cluster。关键在于理解 distance(data[cluster[i][0]], data[cluster[j][0]]);数据2:data2.txt。原创 2023-10-26 20:50:46 · 339 阅读 · 0 评论 -
KNN算法 c++实现
k-近邻(kNN, k-NearestNeighbor)是在训练集中选取离输入的数据点最近的k个邻居,根据这个k个邻居中出现次数最多的类别(最大表决规则),作为该数据点的类别。某班有14个同学,已登记身高及等级,新同学易昌,身高1.74cm,等级是什么。请用knn算法进行分类识别,其中k=5。原创 2023-10-18 16:30:21 · 1010 阅读 · 0 评论