人工智能决策树大作业

Zrone10

已于 2022-12-31 18:58:38 修改

阅读量2.8k

点赞数 2

文章标签：决策树人工智能

于 2022-12-29 19:53:33 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_45202602/article/details/128487083

版权

人工智能技术: 机器学习之决策树大作业

以西瓜集 2.0 为建模数据，采用交叉验证方法进行数据训练集和验证集的划分，实现决策树 “预剪枝”算法，要求:尽可能充分利用有限的西瓜集 2.0 数据所提供信息，建立泛化能力强的决策树模型。（2）提交报告内包含交叉验证部分和决策树建模部分核心程序截图；(3) 对建模结果要有分析部分。

理论定义

优秀的决策树：

优秀的决策树不仅对数据具有良好的拟合效果，而且对未知的数据具有良好的泛化能力，优秀的决策树具有以下优点：1.深度小；2.叶节点少；3深度小并且叶节点少.

剪枝的目的：处理决策树的过拟合问题。

预剪枝：生成过程中，对每个结点划分前进行估计，若当前结点的划分不能提升 [泛化能力] ，则停止划分，记当前结点为叶结点。

预剪枝的方法：

限定决策树的深度；设定一个阈值；设置某个指标，比较节点划分前后的泛化能力

交叉验证：

如果给定样本数据充足，进行模型选择的一种简单方法是随机地将数据集切分为3部分，分为训练集、验证集和测试集。

简单交叉验证：随机将数据划分为两部分，训练集和测试集。

数据处理

整个西瓜集2.0使用ID3算法生成的决策树：

简单交叉验证：随机将数据划分为两部分，训练集和测试集，各50%。

训练集

测试集

训练集ID3算法生成的决策树：

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。