1. weka简介
1) weka是新西兰怀卡托大学WEKA小组用JAVA开发的机器学习/数据挖掘开源软件。
2) 相关资源链接
http://sourceforge.net/projects/weka/files/
http://www.cs.waikato.ac.nz/ml/weka/
3) 主要特点
- 集数据预处理、学习算法(分类、回归、聚类、关联分析)和评估方法等为一体的综合性数据挖掘工具
- 具有交互式可视化界面
- 提供算法学习比较环境
- 通过其接口,可实现自己的数据挖掘算法
2. 数据集(.arff文件)
数据集的呈现形式如上图所示,其表现为一个二维表,其中:
- 表格里一行称作一个实例(Instance),相当于统计学中的一个样本,或者数据库中的一条记录
- 表格里一列称作一个属性(Attribute),相当于统计学中的一个变量,或者数据库中的一个字段