Weka各类分类器的使用（Java）

最新推荐文章于 2024-07-23 10:30:00 发布

转载最新推荐文章于 2024-07-23 10:30:00 发布 · 3.6k 阅读

·

0

·

Data mining and Machine Learni 专栏收录该内容

9 篇文章

订阅专栏

本文介绍了如何在Java环境中利用Weka和LibSVM进行文本分类与预测，包括配置环境、数据转换、算法实现以及评估模型性能的方法。详细步骤涵盖了从导入训练和测试数据、构建模型到进行十交叉验证与模型保存加载的过程。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1.配置

MyEclipse2013+Weka3.6+libsvm3.18+Jdk1.7+Win8.1

2.小Tips

1). Java使用Weka

实现：

将安装文件夹里的weka.jar加入项目编译路径中

2). CSV文件可以转换成Arff文件

实现：

运行Weka的Explorer界面，打开csv文件，保存为arff文件。

注意：

如果有训练集和测试集，将训练集的Arff文件的标签头复制到测试集的Arff文件！

3). Java通过Weka使用LibSVM

实现：

将LibSVM文件夹里的libsvm.jar加入项目编译路径中

3.示例

public static void main(String[] args) {

try {

Classifier classifier1;

Classifier classifier2;

Classifier classifier3;

Classifier classifier4;

File inputFile = new File(

"C:\\Users\\zhangzhizhi\\Documents\\Everyone\\张志智\\总结积累\\Weka\\change_train.arff");// 训练语料文件

ArffLoader atf = new ArffLoader();

atf.setFile(inputFile);

Instances instancesTrain = atf.getDataSet(); // 读入训练文件

inputFile = new File(

"C:\\Users\\zhangzhizhi\\Documents\\Everyone\\张志智\\总结积累\\Weka\\change_test.arff");// 测试语料文件

atf.setFile(inputFile);

Instances instancesTest = atf.getDataSet(); // 读入测试文件

instancesTest.setClassIndex(0);

instancesTrain.setClassIndex(0);

// 朴素贝叶斯算法

classifier1 = (Classifier) Class.forName(

"weka.classifiers.bayes.NaiveBayes").newInstance();

// 决策树

classifier2 = (Classifier) Class.forName(

"weka.classifiers.trees.J48").newInstance();

// Zero

classifier3 = (Classifier) Class.forName(

"weka.classifiers.rules.ZeroR").newInstance();

// LibSVM

classifier4 = (Classifier) Class.forName(

"weka.classifiers.functions.LibSVM").newInstance();

classifier4.buildClassifier(instancesTrain);

classifier1.buildClassifier(instancesTrain);

classifier2.buildClassifier(instancesTrain);

classifier3.buildClassifier(instancesTrain);

Evaluation eval = new Evaluation(instancesTrain);

eval.evaluateModel(classifier4, instancesTest);

System.out.println(eval.errorRate());

eval.evaluateModel(classifier1, instancesTest);

System.out.println(eval.errorRate());

eval.evaluateModel(classifier2, instancesTest);

System.out.println(eval.errorRate());

eval.evaluateModel(classifier3, instancesTest);

System.out.println(eval.errorRate());

} catch (Exception e) {

e.printStackTrace();

}

}

如果只有训练集，采用十交叉验证的方法，将上面的第5步和第6步更改为如下代码：

Evaluation eval = new Evaluation(instancesTrain);

eval.crossValidateModel(classifier4, instancesTrain, 10, new Random(1));

System.out.println(eval.errorRate());

eval.crossValidateModel(classifier1, instancesTrain, 10, new Random(1));

System.out.println(eval.errorRate());

eval.crossValidateModel(classifier2, instancesTrain, 10, new Random(1));

System.out.println(eval.errorRate());

eval.crossValidateModel(classifier3, instancesTrain, 10, new Random(1));

System.out.println(eval.errorRate());

如果需要保存和加载分类器模型参数，在第5步和第6步之间加入如下代码：

SerializationHelper.write("LibSVM.model", classifier4);

SerializationHelper.write("NaiveBayes.model", classifier1);

SerializationHelper.write("J48.model", classifier2);

SerializationHelper.write("ZeroR.model", classifier3);

Classifier classifier8 = (Classifier) weka.core.SerializationHelper.read("LibSVM.model");

Classifier classifier5 = (Classifier) weka.core.SerializationHelper.read("NaiveBayes.model");

Classifier classifier6 = (Classifier) weka.core.SerializationHelper.read("J48.model");

Classifier classifier7 = (Classifier) weka.core.SerializationHelper.read("ZeroR.model");

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。