
数据挖掘
oTianKongYanLei
这个作者很懒,什么都没留下…
展开
-
Apriori算法
Apriori算法是挖掘最简单频繁模式的方法(单维度,单层,布尔频繁项集)。介绍算法前先介绍两个概念Support和Confidence翻译成中文就是支持度和置信度(两个值都是百分数),我在这里举个例子让大家理解这两个概念:假设有10个球,白色的球有3个,那么白球的支持度就是30%,而置信度则类似于概率里面的概念P(A|B) 。下面就开始介绍算法: 该算法的目的就是挖掘频繁模式所以会有一个su原创 2013-05-10 07:10:18 · 611 阅读 · 0 评论 -
用于分类的决策树简介
顾名思义,训练完成的决策树的功能就是能够决策树能够识别输入的元组的类型。比较有名的决策树算法有C4.5,ID3,CART(他们的主要区别是利用的分裂准则不同)。 构造决策树简单的来说就是一句话,每次利用分裂准则进行属性的选择和分裂(毕竟树就是由一个个属性的节点构成,所以所有的算法都是集中在判断属性节点的位置而已) 分裂准则:一棵树越顶层的节点对决策的走向影响越大(和位于高层的人说话影响大一个意原创 2013-05-13 19:44:48 · 884 阅读 · 0 评论