《机器学习工具与方法》--- WEKA实战一

本文介绍了使用WEKA工具对weather和glass数据集进行数据预处理,包括添加新属性、离散化分析。针对weather数据,通过AddUserFields和AddValues过滤器添加了Mode属性并填充值。对于glass数据,查看了Fe属性并尝试了等宽和等频离散化,分析了离散化对处理数值型属性的影响。离散化能够提高学习算法的效果。

《机器学习工具与方法》— WEKA实战一


第一题

题目:weather数据中,添加Mode属性,设置为nominal类别,并设置和输入mode的值

解答:

  1. 导入weather数据集

  2. 选择AddUserFields过滤器,并在编辑框中增加新属性Mode,设置为nominal类别,然后应用该过滤器。操作过程如下图所示:image-20211016093759337.png

  3. 选择AddValues过滤器,编辑其标签为good&bad,应用后即可在数据编辑框中进行数据填写,操作过程如下:image-20211016094737590.png
    image-20211016094709248.png

第二题

题目:glass数据中查看Fe属性,并进行离散化分析

解答:

  1. 导入glass数据集,并查看Fe(铁)元素属性,操作结果如下图:image-20211016095419917.png

  2. 我们选用的是无监督离散化方法,首先,我们使用其默认的离散化设置,即等宽离散化方法,结果如下图所示:image-20211016101027101.png

  3. 接着我们使用等频的离散化方法,将useEqualFrequency改为True,操作结果如下图所示:image-20211016101226168.png

  4. 进一步分析:一般情况下,等频离散化后直方图大致等高,而

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值