最近想看看数据挖掘是个什么东西,因此特别的关注了下,首先看看数据挖掘包含哪些算法,网上找到了十大经典算法:
01.C4.5:是机器学习算法中的一种分类决策树算法,其核心算法是ID3算法。
02.K-means算法:是一种聚类算法。
03.SVM:一种监督式学习的方法,广泛运用于统计分类以及回归分析中
04.Apriori :是一种最有影响的挖掘布尔关联规则频繁项集的算法。
05.EM:最大期望值法。
06.pagerank:是google算法的重要内容。
07.Adaboost:是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器然后把弱分类器集合起来,构成一个更强的最终分类器。
08.KNN:是一个理论上比较成熟的的方法,也是最简单的机器学习方法之一。
09.Naive Bayes:在众多分类方法中,应用最广泛的有决策树模型和朴素贝叶斯(Naive Bayes)
10.Cart:分类与回归树,在分类树下面有两个关键的思想,第一个是关于递归地划分自变量空间的想法,第二个是用验证数据进行减枝。
看完发现这不就是模式识别的常用算法吗,看来哥也可以转行做数据挖掘了!