本组成员利用id3和c4.5对数据进行分析和处理,在获取相关数据方面,本组将数据写入excel文件中,并将其命名为data,然后进度读取和分析处理。
数据预处理是分别利用c4.5和id3
实验数据:
收入 | 身高 | 长相 | 体型 | 是否见面 |
一般 | 高 | 丑 | 胖 | 否 |
高 | 一般 | 帅 | 瘦 | 是 |
一般 | 一般 | 一般 | 一般 | 否 |
高 | 高 | 丑 | 一般 | 是 |
一般 | 高 | 帅 | 胖 | 是 |
下面是对决策树的实验代码:
首先调用matplotlib包
# 绘制决策树
import matplotlib.pyplot as plt
再进行文本框的和箭头格式的定义
decisionNode = dict(boxstyle="round4", color='#ccccff') # 定义判断结点为圆角长方形,填充浅蓝色
leafNode = dict(boxstyle="circle", color='#66ff99') # 定义叶结点为圆形,填充绿色
arrow_args = dict(arrowstyle="<-", color='#ffcc00') # 定义箭头及颜色
上述代码中 boxstyle用于指定边框类型
此方法是对带箭头的注释:
def plotNode(nodeTx