问题定义:
按照信息增益大的贪心思想,构建的树能不能保证最小?
答:
不能
举例子:
物品: a b c d e f g h
类别: 1 1 1 1 0 0 0 0
特征1: 1 1 0 0 1 0 0 0
特征2: 1 1 0 0 1 1 0 0
特征3: 0 0 1 1 0 0 1 1
按照贪心,应该选特征1做分裂,信息增益最大,但是这样子树要三层。
但是特征2+特征3才是最小的树,只要两层。
问题定义:
按照信息增益大的贪心思想,构建的树能不能保证最小?
答:
不能
举例子:
物品: a b c d e f g h
类别: 1 1 1 1 0 0 0 0
特征1: 1 1 0 0 1 0 0 0
特征2: 1 1 0 0 1 1 0 0
特征3: 0 0 1 1 0 0 1 1
按照贪心,应该选特征1做分裂,信息增益最大,但是这样子树要三层。
但是特征2+特征3才是最小的树,只要两层。