
机器学习
机器学习基础知识
IN_Joseph
这个作者很懒,什么都没留下…
展开
-
机器学习【1】决策树Decision Tree
1 决策树分类原理决策树是通过一系列规则对数据进行分类的过程。它提供一种在什么条件下会得到什么值的类似规则的方法。决策树分为分类树和回归树两种,分类树对离散变量做决策树,回归树对连续变量做决策树。近来的调查表明决策树也是最经常使用的数据挖掘算法,它的概念非常简单。决策树算法之所以如此流行,一个很重要的原因就是使用者基本上不用了解机器学习算法,也不用深究它是如何工作的。直观看上去,决策树分类器就像判断模块和终止块组成的流程图,终止块表示分类结果(也就是树的叶子)。判断模块表示对一个特征取值的判断(该特征有转载 2020-08-08 18:49:20 · 1170 阅读 · 0 评论 -
机器学习【1】决策树中ID3、C4.5、C5.0、CART、CHAID、QUEST算法
C4.5和C5.0的区别:C5.0是C4.5应用于大数据集上的分类算法,主要在执行效率和内存使用方面进行了改进。CHAID算法根节点的选取:每个输入变量和输出变量(标签)做独立性检验,卡方值最大(P值最小)的为父节点,也就是说,跟输出变量相关的显著性最高的变量作为根节点。节点的分裂:一、连续型输入变量:1、先将输入变量进行区间划分,比如输入变量为价格,价格的最小单位是1元,那么,组距为1,划分区间为[1]、[2]、[3]、…,计算每个区间里面的频数,再算出与输出变量的交叉表。.原创 2020-08-26 14:39:26 · 2156 阅读 · 0 评论