weka中实现了很多机器学习算法,不管实验室研究或者公司研发,都会或多或少的要使用weka,我的理解是weka是在本地的SparkML,SparkML是分布式的大数据处理机器学习算法,数据量不是很大的时候,使用weka可以模拟出很好的效果,决定使用哪个模型,然后再继续后续的数据挖掘工作。
下面总结一个eclipse中调用weka的Classifier分类器代码的Demo,通过这个实例,可以进一步跟踪分类算法的原理,查看weka源码,下一节中,介绍最简单的IB1(1NN)算法源码的具体分析。
以下是一个调用各种IB1分类器的过程。
package mytest;
import java.io.File;
import weka.classifiers.Classifier;
import weka.classifiers.Evaluation;
import weka.classifiers.lazy.IB1;
import weka.core.Instance;
import weka.core.Instances;
import weka.core.converters.ArffLoader;
//import wlsvm.WLSVM;
public class SimpleClassification {//分类器
public static void main(String[] args) {
Instances ins = null;
Classifier cfs = null;
try {
File file = new File("E:\\Develop/Weka-3-6/data/contact-lenses.arff");
// File file = new File("E:\\yuce/data.csv");
ArffLoader loader = new ArffLoader();
loader.setFile(file);
ins = loader.getDataSet();

本文介绍了如何在Eclipse中调用Weka的Classifier进行机器学习分类。通过一个详细的代码Demo,展示了从读取ARFF数据集,创建分类器,设置参数,到执行交叉验证和评估的过程。数据集包含年龄属性和类别标签,最终输出了分类结果和评估指标。
最低0.47元/天 解锁文章

530

被折叠的 条评论
为什么被折叠?



