[weka]初识weka(一)

本文介绍使用Weka平台进行数据挖掘的实践,包括数据规范化、深入数据分析及算法应用。通过实操案例,了解如何在Weka环境中加载数据、分析属性与目标变量之间的关系,并初步掌握数据挖掘与机器学习的区别。本文旨在为初学者提供从应用角度入门数据挖掘的路径。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

   Weka是一款开源的Java数据挖掘平台,它诞生于 University of Waikato(新西兰).其官网上极其详尽的介绍说明,同时作者还提供了在线视频教程,优酷上已经有中文字幕版了,可谓是业界良心。

  在课程的第一课中,作者对用现实例子对数据挖掘的应用进行讲解,并提到机器学习与数据挖掘的关系。他认为机器学习侧重的是算法,而数据挖掘侧重的是应用。我自认为还研究算法的能力还不够,先从应用来入手吧。

  Weka的安装之后,里面有一个data的文件夹,它里面放着一些作为sample的数据供参考,数据文件的后缀都是.arff。


根据视频的第一课,我们从Exploer进入,打开data中的weather.nominal数据。


可以从界面看到这组数据一共有14条记录,5个属性。通过点击选取不同的属性可以看到各个属性值在记录中出现的次数。右下角的图表中蓝色表示play属性为yes,红色表示no.通过对比我们可以比较各个属性与play属性之间的关系。
    这一课初步展现出Weka对数据的分析与表现能力。   
我接下来想知道的是,1、如何规范要处理的数据;2、如何进一步分析数据;3、如何利用算法分析。


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值