
SPSS Clementine 12 数据挖掘
SmileCloud201
这个作者很懒,什么都没留下…
展开
-
分类回归树 C&R Tree
一、数据来源:Demos文件夹下面自带的数据 NewsChan.sav 数据格式为SPSS文件格式 二、clementine 流程图 2.1 数据表的数据 2.2 表的字段解释: 2.3 Type节点配置 说明:1. 类型节点指定每个字段的数据类型。例如,范围字段指示字段具有连续数值(如年龄),而集合字段则有两个或原创 2013-01-22 20:11:02 · 3200 阅读 · 0 评论 -
决策树算法
决策树的缺点:1、不易处理连续的数据。2、对缺失数据难以处理。由于不能对缺失的数据产生正确的分支进而影响了整个决策树的生成。3、决策树的过程忽略了数据库属性间的相关性。 决策树算法分为两类:1、基于信息论 ID系列,例如:C4.52、最小GINI指示 CARPT、SLIQ、SPRINT算法 评价的标准:1、决策树的复杂度2、分类原创 2013-03-13 17:44:17 · 1172 阅读 · 0 评论 -
关联规则算法
关联规则是无监督的学习方法,可以帮助商务决策的制定,如分类设计、交叉购物等。定义: 设I={i1,i2…,im}为所有项目的集合,设A是一个由项目构成的集合,称为项集。事务T包含项集A,当且仅当AT。如果项集A中包含k个项目,则称其为k项集。D为事务数据库,项集A在事务数据库D中出现的次数占D中总事务的百分比叫做项集的支持度(support)。如果项集的支持度超过用户给定的最原创 2013-03-15 10:56:53 · 1619 阅读 · 0 评论