分类树:原理、算法与应用
1. 神经元分类示例引入
在神经元分类的领域中,有一个有趣的现象。通过IB3对神经元进行分类,会出现不同的结果。比如,有正确分类为中间神经元(interneuron)的x145,正确分类为锥体神经元(pyramidal neuron)的x241,也有将中间神经元x64误分类为锥体神经元,以及将锥体神经元x207误分类为中间神经元的情况。这就引出了我们要探讨构建分类树来更准确地进行神经元分类。
2. 分类树基础概念
2.1 分类树结构
分类树,也叫决策树,是一种将实例空间进行递归划分的分类器。它有三种节点:
- 根节点:没有入边,有多个出边。
- 内部节点(测试节点):有一个入边和多个出边。
- 终端节点(决策节点,即叶子节点):有一个入边,没有出边。
每个非叶子节点会根据变量值的函数将实例空间划分为两个或更多子空间。这个函数对于离散变量通常是一个值,对于连续变量通常是一个值的范围。节点用测试的变量标记,分支用相应的值标记。每个叶子节点被分配一个类值,叶子节点用矩形表示,其他节点用圆形表示。根节点包含用于生成树的训练样本,后代节点的划分比前一个节点更细,所以后代节点包含训练样本的子集。
2.2 分类过程与规则转换
对于未见过的实例,会从根节点开始,根据路径上测试的结果向下遍历到叶子节点,叶子节点包含预测的类。从分类树的根节点到叶子节点的每条路径都可以转换为一条规则,将路径上的测试条件组合起来形成规则的前件,叶子节点的类预测形成规则的后件。因此,分类树表示实例变量值的合取的析取。对于连续变量X,通常测试X ≥ x或X < x,所以分
超级会员免费看
订阅专栏 解锁全文
1645

被折叠的 条评论
为什么被折叠?



