Decision Tree

本文深入解析决策树算法,包括ID3、C4.5及CART三种版本的特点与不足。探讨了信息熵、信息增益、基尼系数等概念,以及它们在决策树构建中的应用。同时,对比了不同算法在处理连续值、缺失值、过拟合等方面的表现。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

决策树算法既可用于分类也可用于回归,常见的三个版本:ID3,C4.5,CART。scikit-learn使用了优化版的CART算法作为其决策树算法的实现。


ID3:

信息熵表示了信息的混乱程度:

H(x) = -\sum_{i=1}^nP_i*log_2P_i

信息增益:

I(D|A) = H(D) -H(D|A)

比如我们有15个样本D,输出为0(6个)或者1(9个)。 样本有个特征A,取值为A1(5个),A2(5个),A3(5个)。在取值为A1的样本的输出中,有3个输出为1, 2个输出为0,取值为A2的样本输出中,2个输出为1,3个输出为0, 在取值为A3的样本中,4个输出为1,1个输出为0。则:

H(D) = -\frac{9}{15}log\frac{9}{15}-\frac{6}{15}log\frac{6}{15}=0.971

H(D|A) = -\frac{5}{15}(\frac{3}{5}log\frac{3}{5}+\frac{2}{5}log\frac{2}{5})-\frac{5}{15}(...)-\frac{5}{15}(\frac{4}{5}log\frac{4}{5}+\frac{1}{5}log\frac{1}{5})=0.888

I(D|A) = H(D) -H(D|A) = 0.083

ID3的不足:

  • 无法处理连续值特征
  • 无法处理缺失值
  • 没有考虑过拟合
  • 信息增益对可取值数目多的特征有偏好

C4.5:

C4.5针对ID3的四个问题做了改进。用信息增益比代替了信息增益,并引入正则化系数进行初步剪枝。但是还存在问题:

  • 由于决策树算法非常容易过拟合,因此对于生成的决策树必须要进行剪枝
  • C4.5生成的是多叉树,计算机中二叉树模型会比多叉树运算效率高
  • C4.5只能用于分类
  • C4.5由于使用了熵模型,有大量耗时的对数运算,如果是连续值还有大量的排序运算

CART:

CART分类树使用基尼系数来代替信息增益比。基尼系数代表了模型的不纯度,基尼系数越小,则不纯度越低,特征越好。这和信息增益(比)是相反的。具体的,在分类问题中,假设D中有K个类别,第k个类别的概率为pk, 则基尼系数的表达式为: 

Gini(D) = \sum_{k=1}^{K}p_k(1-p_k)=1-\sum_{k=1}^{K}p_k^2

Gini(D,A)=\frac{|D1|}{|D|}Gini(D1)+\frac{|D2|}{|D|}Gini(D2)

CART采用了后剪枝+交叉验证;二叉树模型;既能用于分类又能用于回归

内容概要:该论文探讨了一种基于粒子群优化(PSO)的STAR-RIS辅助NOMA无线通信网络优化方法。STAR-RIS作为一种新型可重构智能表面,能同时反射和传输信号,与传统仅能反射的RIS不同。结合NOMA技术,STAR-RIS可以提升覆盖范围、用户容量和频谱效率。针对STAR-RIS元素众多导致获取完整信道状态信息(CSI)开销大的问题,作者提出一种在不依赖完整CSI的情况下,联合优化功率分配、基站波束成形以及STAR-RIS的传输和反射波束成形向量的方法,以最大化总可实现速率并确保每个用户的最低速率要求。仿真结果显示,该方案优于STAR-RIS辅助的OMA系统。 适合人群:具备一定无线通信理论基础、对智能反射面技术和非正交多址接入技术感兴趣的科研人员和工程师。 使用场景及目标:①适用于希望深入了解STAR-RIS与NOMA结合的研究者;②为解决无线通信中频谱资源紧张、提高系统性能提供新的思路和技术手段;③帮助理解PSO算法在无线通信优化问题中的应用。 其他说明:文中提供了详细的Python代码实现,涵盖系统参数设置、信道建模、速率计算、目标函数定义、约束条件设定、主优化函数设计及结果可视化等环节,便于读者理解和复现实验结果。此外,文章还对比了PSO与其他优化算法(如DDPG)的区别,强调了PSO在不需要显式CSI估计方面的优势。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值