100、四种数据挖掘软件的比较与应用

四种数据挖掘软件的比较与应用

四种数据挖掘软件的比较与应用

1. 引言

在数据挖掘领域,有许多非免费开源的软件可供选择。本文将介绍四种这样的数据挖掘软件:SAS® Enterprise MinerTM、Megaputer PolyAnalyst® 5.0、NeuralWare Predict® 和 BioDiscovery GeneSight®。这些软件由相关厂商以学术优惠价格提供,用于课堂教学和支持研究。我们将对它们的现有功能、特点和算法进行描述和比较,并将它们应用于一个包含 63,377 行和 54 个属性的森林覆盖类型大型数据库。

2. 背景知识
2.1 历史背景

数据挖掘的算法一直是研究的重点。不同学者对其进行了广泛讨论,例如 Han 和 Kamber(2006)、Kleinberg 和 Tardos(2005)以及 Fayyad 等人(1996)。算法是指具有完全定义的步骤或操作,能产生特定结果的过程,这与基于理论推理或统计证据的启发式方法不同。数据挖掘被定义为从大型数据库中提取隐藏的预测信息,像 The Data Intelligence Group(1995)所描述的那样,数据挖掘工具会在数据库中搜索隐藏模式。

同时,不同的研究者还对数据挖掘的不同方面进行了阐述。Brooks(1997)区分了基于规则的工具和算法;Witten 和 Frank(2005)描述了数据挖掘算法的工作原理,包括覆盖算法、基于实例的学习等,并介绍了开源数据挖掘软件 WEKA 的使用。此外,关于微阵列数据库的研究也有很多,如 Segall(2006)对生物技术中的微阵列数据库进行了详细介绍,Piatetsky - Shapiro(2003)讨论了微阵列数据挖掘的挑战。

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值