决策树原理学习笔记(二)

上篇文章介绍了ID3和C4.5算法,针对C4.5算法的缺点,本文介绍CART树算法,CART树既能用于分类,也能用于回归,Scikit-Learn官网的决策树算法也是使用了CART树实现。

1. 二叉树

CART树处理划分所有特征为“是”和“否”,即每个节点都只能分裂称两个节点。假设特征A有3个取值,A1,A2和A3,若使用了ID3和C4.5决策树算法,则节点会分裂成三个子节点;若使用了CART决策树算法,节点会分裂成两个节点,如A1和{A2,A3},{A1,A2}和A3等,二叉树叫多叉树的运算效率高。

2. 模型不确定性的度量指标

ID3和C4,5算法使用熵度量了数据的不确定性,因为其使用了对数运算造成了算法计算量大。

CART树使用了基尼系数来衡量数据的不确定性,去掉了对数运算。

对于给定的样本D,假设有K个类别,第K个类别的数量为,其基尼系数为:

基尼系数越小,不确定性越小,特征越好,含义与熵相反。

3. CART树建立算法

上一节我们知道了使用基尼系数衡量数据的不确定性,CART树建立算法与

C4.5,ID3相似,选择某一特征使得划分后的节点,其基尼系数最小。

上述是针对分类算法,若我们需要构建CART回归树时,如何衡量数据的损失函数?

最常用的方法是使用均方差函数来衡量数据各个切点划分的好坏,公式为:

其中c1为D1样本的平均值,c2为D2样本的平均值,s为特征A的划分切点。

4. CART树剪枝策略

ID3和C4.5算法会造成模型的过拟合,为了防止过拟合,我们需要对CART树进行剪枝,剪枝是在生成CART树后进行的。

我们把CART树的每一个节点当成是一个根节点,基于该根节点的CART树为子树

子树的正则化损失函数为:

其中为叶节点个数,α为正则化系数,为子树的损失函数,当用于分类任务时,损失函数为Gini系数;用于回归任务时,损失函数为均方差。

若把该子树的所有节点都剪掉,只剩下根节点,则损失函数为:

当α较小时:

逐渐增大α时,使下面等式成立:

根据等式反推正则化系数α,有:

因此我们计算每个子树对应的α,使得剪枝前后的损失函数相等。然后对剪枝后的树进行交叉验证,选择交叉验证率最优时的α,根据已选择的最优正则化系数α进行剪枝。

参考:

https://www.cnblogs.com/pinard/p/6053344.html

欢迎扫码关注:

内容概要:本文介绍了一个基于多传感器融合的定位系统设计方案,采用GPS、里程计和电子罗盘作为定位传感器,利用扩展卡尔曼滤波(EKF)算法对多源传感器数据进行融合处理,最终输出目标的滤波后位置信息,并提供了完整的Matlab代码实现。该方法有效提升了定位精度与稳定性,尤其适用于存在单一传感器误差或信号丢失的复杂环境,如自动驾驶、移动采用GPS、里程计和电子罗盘作为定位传感器,EKF作为多传感器的融合算法,最终输出目标的滤波位置(Matlab代码实现)机器人导航等领域。文中详细阐述了各传感器的数据建模方式、状态转移与观测方程构建,以及EKF算法的具体实现步骤,具有较强的工程实践价值。; 适合人群:具备一定Matlab编程基础,熟悉传感器原理和滤波算法的高校研究生、科研人员及从事自动驾驶、机器人导航等相关领域的工程技术人员。; 使用场景及目标:①学习和掌握多传感器融合的基本理论与实现方法;②应用于移动机器人、无人车、无人机等系统的高精度定位与导航开发;③作为EKF算法在实际工程中应用的教学案例或项目参考; 阅读建议:建议读者结合Matlab代码逐行理解算法实现过程,重点关注状态预测与观测更新模块的设计逻辑,可尝试引入真实传感器数据或仿真噪声环境以验证算法鲁棒性,并进一步拓展至UKF、PF等更高级滤波算法的研究与对比。
内容概要:文章围绕智能汽车新一代传感器的发展趋势,重点阐述了BEV(鸟瞰图视角)端到端感知融合架构如何成为智能驾驶感知系统的新范式。传统后融合与前融合方案因信息丢失或算力需求过高难以满足高阶智驾需求,而基于Transformer的BEV融合方案通过统一坐标系下的多源传感器特征融合,在保证感知精度的同时兼顾算力可行性,显著提升复杂场景下的鲁棒性与系统可靠性。此外,文章指出BEV模型落地面临大算力依赖与高数据成本的挑战,提出“数据采集-模型训练-算法迭代-数据反哺”的高效数据闭环体系,通过自动化标注与长尾数据反馈实现算法持续进化,降低对人工标注的依赖,提升数据利用效率。典型企业案例进一步验证了该路径的技术可行性与经济价值。; 适合人群:从事汽车电子、智能驾驶感知算法研发的工程师,以及关注自动驾驶技术趋势的产品经理和技术管理者;具备一定自动驾驶基础知识,希望深入了解BEV架构与数据闭环机制的专业人士。; 使用场景及目标:①理解BEV+Transformer为何成为当前感知融合的主流技术路线;②掌握数据闭环在BEV模型迭代中的关键作用及其工程实现逻辑;③为智能驾驶系统架构设计、传感器选型与算法优化提供决策参考; 阅读建议:本文侧重技术趋势分析与系统级思考,建议结合实际项目背景阅读,重点关注BEV融合逻辑与数据闭环构建方法,并可延伸研究相关企业在舱泊一体等场景的应用实践。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值