weka使用记录

这篇博客记录了作者在使用Weka工具进行机器学习实验时的学习过程,主要涉及分类器、聚类和特征选择。作者探讨了在选择算法后如何设置测试方式,包括使用全部数据测试、导入测试集以及交叉验证的概念。对于交叉验证,作者解释了10折交叉验证的原理,并指出其在参数调整中的作用。文章中还提到了Weka界面的评估指数设置问题以及预测值出现问号的困惑。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

前言

最近做实验需要用到weka这个工具,不是机器学习出生,懵懵懂懂啊。这个帖子不是系统地整理,只是简单地记录我对这个工具熟悉的每一步,甚至还没有逻辑??。

记录

目前只用到explorer这个界面,里面包含了分类器、聚类、特征选择等。

Classifier部分,选择了算法之后,还要选择Test Options这部分。这部分的选项意思是:你要通过什么样的方式来测试你训练出来的模型。

  1. Using training set ,就是说使用你导入的所有的数据(导入是在preprocess界面导入的)来测试模型。这里说一下,训练模型是通过导入的所有数据训练的,这里选择测试数据集就只是选择测试集而已。如下图所示:
    在这里插入图片描述

    显示说是使用了full training set训练得到的模型,模型训练总共花了48.58秒。

    1. Supplied test set是说额外导入一个测试集,在这个测试集上测试模型
    2. cross validation,这个是我最疑惑的,网上查交叉验证是什么,都是直接说分成k份,1份做测试,剩下做训练。但我还是不明白这个东西用在这里是干嘛。后来查着查着才知道,这里说的交叉验证是说(假定是10折),进行10次测试,将10次测试的准确率作为模型最终的准确率。对,就是这么简单。然后十折交叉验证可以用来调参,和GridSearchCV结合在一起(搜索关键词十折交叉验证调参)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值