决策树:如何高效的进行决策。
特征的先后顺序
决策树分类原理详解
已知四个特征,是否贷款给某个人?
先看房子,在工作 -》是否贷款
能够找到一种高效的方法,自动找到先要去哪个进行查询
需用引入信息论的意思
信息论
香农定义:消除随机不定性的东西
信息的衡量-信息量-信息熵
一般对信息熵进行计算,以2为底
相当于我们正在做消除给某人贷款的不确定性
信息增益:
信息增益就是我们再知道了一个信息之后的减少的信息不确定性
哪个特征不确定性减少的越多,那么我们就应该首先关注这个特征
决策树划分的依据之一————信息增益
决策树可视化