- 学习资料
IBM SPSS Modeler 18.0 Applications 第8章
-
数据源描述
数据源名称:DRUG IN数据文件

-
应用模型
C5.0
C5.0 节点可以构建决策树或规则集。该模型的工作原理是根据在每个级别提供最大信息收获的字段拆分样本。目标字段必须为分类字段。允许进行多次多于两个子组的拆分。不支持交互式树创建
- 分析思路
已收集了关于身患同一疾病的一组患者的数据。在治疗过程中,每位患者均对五种药物中的一种有明显反应,您通过数据挖掘找出适用于今后患有此疾病的患者的药物。
- 设计步骤
1、选取源节点“var.file”,读取外部数据源;
选中从文件读取字段名称Read file names from files
数据选项卡,可以覆盖和更改某个字段的存储(这里的存储不同于测量)
类型选项卡,可以帮助解数据中的更多字段类型。还可以选择 读取值 来查看各个字段的实际值



本文详细介绍了如何使用IBM SPSS Modeler 18.0的C5.0节点构建决策树。通过数据源描述、分析思路、设计步骤,展示了从数据读取、预处理到模型构建的过程,旨在预测疾病患者的适用药物。重点讨论了字段类型设置、新字段导出、模型训练与评估,特别是C5.0算法的参数调整,如使用Boosting、修剪严重性和最小记录数等,以提高模型准确性和泛化能力。
最低0.47元/天 解锁文章

被折叠的 条评论
为什么被折叠?



