
大数据
文章平均质量分 85
Gavana.
个人博客——https://gavana.top
B站——土水不服(https://space.bilibili.com/602989659)
展开
-
用神经网络玩转数据聚类:自编码器的原理与实践
本文介绍了如何使用matlab来实现一个简单的基于自编码器的聚类算法,并对鸢尾花数据集进行了实验。本文还介绍了自编码器的原理、特点、应用场景和相关资源。本文旨在帮助读者理解和掌握自编码器的基本概念和用法。希望对来访读者有所帮助~原创 2023-08-07 22:52:45 · 2207 阅读 · 0 评论 -
Python实现决策树算法:完整源码逐行解析
接下来,我们需要定义一个表示决策树节点的类 Node 和一个表示决策树本身的类 Tree。feature:节点的划分特征的索引,如果是叶子节点,则为 Nonevalue:节点的划分特征的值,如果是叶子节点,则为 Nonelabel:节点的类别标签,如果是叶子节点,则为该节点所属的类别,如果是非叶子节点,则为该节点所包含的样本中最多的类别left:节点的左子树,如果没有,则为 Noneright:节点的右子树,如果没有,则为 Noneroot:树的根节点,初始为 None。原创 2023-08-05 07:10:29 · 7581 阅读 · 11 评论 -
Matlab实现Bi-Kmeans算法(每行代码标注详细注解)
K-means和bi-kmeans算法都是基于欧式距离进行聚类分析的方法,它们都试图最小化每个簇内数据点与其聚类中心之间距离之和。它们之间主要区别在于如何确定聚类个数k和如何选择初始聚类中心。K-means算法需要人为指定k值,并且随机选择初始聚类中心;而bi-kmeans算法可以根据数据集的特征自动确定k值,并且按照一定的规则选择初始聚类中心。因此,bi-kmeans算法相比K-means算法更加灵活和稳定,但是也更加耗时和复杂。原创 2023-08-03 18:45:08 · 1259 阅读 · 1 评论 -
Matlab实现Kmeans++算法(每行代码标注详细注解)
K-means算法的缺点是需要事先指定聚类个数k,而这个参数往往难以确定;另外,K-means算法对初始聚类中心的选择敏感,不同的初始聚类中心可能导致不同的聚类结果;而且,K-means算法容易陷入局部最优解,即不能保证找到全局最优解。为了克服K-means算法对初始聚类中心选择敏感和容易陷入局部最优解的问题,一种改进的算法是K-means++算法。K-means++算法与K-means算法的区别仅在于选择初始聚类中心的方法。原创 2023-08-03 18:18:55 · 5453 阅读 · 4 评论 -
Matlab、Python实现Spectral Clustering算法(每行代码标注详细注解)
Spectral Clustering算法的基本思想是将数据点看作图中的节点,将数据点之间的相似度看作图中的边,然后根据图中节点和边的性质进行划分。构建相似度矩阵:首先,我们需要计算每对数据点之间的相似度,并将其存储在一个对称矩阵S中,其中S(i,j)表示第i个数据点和第j个数据点之间的相似度。相似度可以用不同的方式来定义,例如欧氏距离、高斯核函数、余弦相似度等。构建拉普拉斯矩阵:其次,我们需要将相似度矩阵转化为一个拉普拉斯矩阵L,它可以反映图中节点之间的连接关系。原创 2023-08-02 06:49:02 · 996 阅读 · 0 评论 -
Matlab实现AGNES算法(每行代码标注详细注解)
AGNES算法是一种基于层次的聚类算法,它的全称是Agglomerative Nesting,即凝聚式嵌套。AGNES算法的核心思想是从下而上地将数据点按照相似度进行合并,直到达到预设的簇的个数或者满足停止条件。原创 2023-08-01 23:13:26 · 1231 阅读 · 6 评论 -
Matlab实现Kmeans算法(每行代码标注详细注解)
本文主要为了完成平日作业,并进一步加深对算法的理解。也希望对来访的读者有所帮助。目录一、什么是Kmeans算法二、Kmeans算法的意义三、Kmeans算法代码解析1.关键概念2.大致思路3.对照每行代码的详细注解四、总结总结一、什么是Kmeans算法二、Kmeans算法的意义三、Kmeans算法代码解析1.关键概念2.大致思路3.对照每行代码的详细注解function [U, E_in] = KMeans(data, K)[N, .原创 2022-04-03 22:46:43 · 39528 阅读 · 6 评论 -
Matlab实现DBSCAN算法(每行代码标注详细注解)
本文主要为了完成平日作业,并进一步加深对算法的理解。也希望对来访的读者有所帮助。文章目录一、什么是DBSCAN算法 二、DBSCAN算法的意义 三、DBSCAN算法代码解析关键概念 大致思路 对照代码的解读 四、总结一、什么是DBSCAN算法 DBSCAN基于高密度连通区域的、基于密度的聚类算法,能够将具有足够高密度的区域划分为簇,并在具有噪声的数据中发现任意形状的簇。简单来说,DBSCAN目的就是找到密度相连对象的最大集合。...原创 2022-04-02 12:21:41 · 34379 阅读 · 671 评论