Weka是机器学习中的一个非常好的开源工具,对于熟悉Java的同学们来说是一个非常好的选择。Weka几乎包含了所有常见机器学习算法的Java实现,Weka中支持的数据格式主要是arff,虽然weka官网上提供了一些arff文件,但有时仅有这些还不能满足需求,为此,本人搜集各方资料,再加上自己的手工转换,整理出了一个还算比较完整的arff数据集合,在这里分享给大家,希望能对大家有所帮助。本人整理的总共包含了以下的文件。
2dplanes.arff
abalone.arff
ailerons.arff
Amazon_initial_50_30_10000.arff
anneal.arff
anneal.ORIG.arff
arrhythmia.arff
audiology.arff
australian.arff
auto93.arff
autoHorse.arff
autoMpg.arff
autoPrice.arff
autos.arff
auto_price.arff
balance-scale.arff
bank.arff
bank32nh.arff
bank8FM.arff
baskball.arff
bodyfat.arff
bolts.arff
breast-cancer.arff
breast-w.arff
breastTumor.arff
bridges_version1.arff
bridges_version2.arff
cal_housing.arff
car.arff
cholesterol.arff
cleveland.arff
cloud.arff
cmc.arff
colic.arff
colic.ORIG.arff
contact-lenses.arff
cpu.arff
cpu.with.vendor.arff
cpu_act.arff
cpu_small.arff
credit-a.arff