使用weka进行数据挖掘

本文详细介绍了如何将数据转换为Weka可处理的ARFF格式,进行了数据预处理,使用Weka的分类器如J48、SVM等进行分类,并通过十折交叉验证评估了分类效果。结果显示SVM表现最佳,Kappa统计量、平均绝对误差和相对误差均表明分类精度高。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

weka参考教程:

http://wenku.baidu.com/link?url=uKstwSTwVK8bn8EqAUElOhkgEZUQDPJbIpOAbTm65JFcJdgAVKVGePetXLikzUl9GB__VPUAfmD7CbQ_kT9XI3_49mwJjM1S4llBDxlMoAa

首先,本次数据挖掘的使用的数据集是从UCI机器学习知识库中下载的car evaluation,下载地址:

http://archive.ics.uci.edu/ml/

一、将下载好的格式转化为weka可以处理的arff格式

下载好之后文件的大小格式如下图

可以先用MATLAB打开这几个文件看一下里面是什么内容,car.c45-names是以c4.5格式存储的姓名文件,里面包含属性取值和类别。car.names是说明文档,car.data是数据。

怎样把car.data变成weka可以处理的arff文件呢? 首先把car.data改后缀名变成car.csv,然后在weka -> Explorer -> Open file打开csv文件另存为arff文件就可以了。一开始我在data文件里面加入了这么几句话:

我添加了@语句,但是用excel打开csv文件后发现它是这样的:

评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值