1.定义节点(节点的集合形成树);即定义一个结构体Point,而 用Point tree[] 来表示树。
点Point里面包括name(在该点进行分类的特征),val(该点父辈的特征的某个值),n_child(带点子代的数量),*son(指向子代的指针),id(带节点是否有必要存在)
2.全局变量:总数据条数m,总特征数n,总节点数tot,总根节点数root,所有数据的数据集dataset,所有的特征名Cha_name,
3.一些重要的函数:判断输入数据集是否同类;取输入数据集中的较多的一类;计算给定的数据集和对应的信息熵;计算给定的特征的信息熵增益;取最大熵增益对应的特征;根据输入的特征对数据集进行划分;获得某个属性的所有的可能值;种树函数,即形成Point tree[],并展示出来。
决策树算法实现要点
最新推荐文章于 2025-07-01 11:11:30 发布