
数据挖掘
波波的一天
土土的土豆,不喜欢吃兔兔
展开
-
主成分分析(PCA)
主成分分析(PCA) 我们希望将N维数据降低为K维数据,对数据简化有如下一系列原因: 1 使得数据集更易使用使用 2 降低很多算法的计算开销 3 去除噪声 4 使得结果易懂 在所有的降维技术中,PCA的应用目前最为广泛,在PCA中,数据从原来的坐标系转换到了新的坐标系,新坐标系的选择是由数据本身决定的。第一个新坐标轴选择的是原始数据中方差最大的方向,第二个新坐标轴的选择和第一个...原创 2018-11-14 12:51:43 · 306 阅读 · 0 评论 -
层次聚类
层次聚类算法的工作流程如下。首先,每个点自己单独看成一个簇。随着时间的推移,算法会通过合并两个小簇而形成一个大簇。 算法流程 首先,我们假定算法运行在欧式空间下。此时可以允许通过簇质心或者簇内平均点来表示一个簇。注意到对于单点组成的簇,该点就是簇质心,因此可以很直观地对这些簇进行初始化。然后我们将簇之间距离定义为其质心之间的欧氏距离,并选择具有最短距离的两个簇进行合并。 簇之间的距离有很多...原创 2019-03-18 15:42:23 · 707 阅读 · 0 评论 -
序列模式挖掘
算法1-1 AprioriAll算法 输入:大项集阶段转换后的序列数据库DT 输出:所有最长序列 伪代码 (1) L1={large 1-sequences};// 大项集阶段得到的结果 (2) FOR(k=2;Lk-1 ;k++) DO BEGIN (3) Ck=apriori-gen(Lk-1); // Ck是从Lk-1中产生的新的候选者 (4) FOR each c...原创 2019-04-20 20:27:22 · 1170 阅读 · 0 评论