20、深度决策树与随机森林的高级版本及深度线性分类器

最新推荐文章于 2025-08-16 19:45:45 发布

元编程奶

最新推荐文章于 2025-08-16 19:45:45 发布

阅读量38

点赞数

CC 4.0 BY-SA版权

分类专栏：深度学习基础精要文章标签：深度决策树随机森林无监督学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/b9c0d/article/details/151033632

深度学习基础精要专栏收录该内容

42 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

深度决策树与随机森林的高级版本及深度线性分类器

1. 深度决策树的数据分类过程

在深度决策树中，分类数据项的过程如下：决策树由从训练示例映射而来的向量集构建，即 (T_{rh} = {h_1, h_2, \cdots, h_N})。对于新向量 (x)，先通过池化层将其映射为隐藏向量 (h)，然后按照特定过程对映射后的向量 (h) 进行分类，此过程与简单版本的决策树类似，只是多了池化操作。

池化是将输入向量映射为低维向量的过程。构建决策树时，先通过池化层将训练示例映射为各自的隐藏向量，再用这些隐藏向量构建决策树。在这种决策树中，非叶节点是隐藏向量中的属性，边是隐藏向量的元素。我们还可以通过划分隐藏向量集来构建随机森林。

2. 高级深度版本的决策树和随机森林

2.1 无监督决策树

最初决策树是为处理有标签示例的监督学习而设计的，现在将其修改为能处理无标签示例的无监督版本。在使用无监督决策树进行数据项聚类前，需要先确定聚类的数量和初始聚类原型。

2.1.1 连续属性的离散化

在决策树的分支中，每个属性都假设为离散的。离散化连续属性时，先选取最大值和最小值，然后确定它们之间的有限范围数量。连续属性值会被映射为对应其原始值所在范围的离散值。但离散化连续属性的一个问题是如何确定范围数量和每个范围的大小。

2.1.2 根节点的选择

假设每个属性的值数量有限，连续属性已离散化。无标签示例根据其属性值进行聚类，每个聚类由一个属性值表征。计算每个属性值的聚类索引，选择聚类索引最大的属性作为根节点，聚类数量即为给定属性的值数量。

2.1.3 非叶

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符 | 博主筛选后可见

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。