《机器学习工具与方法》— WEKA实战一
第一题
题目:weather数据中,添加Mode属性,设置为nominal类别,并设置和输入mode的值
解答:
-
导入weather数据集
-
选择AddUserFields过滤器,并在编辑框中增加新属性Mode,设置为nominal类别,然后应用该过滤器。操作过程如下图所示:

-
选择AddValues过滤器,编辑其标签为good&bad,应用后即可在数据编辑框中进行数据填写,操作过程如下:


第二题
题目:glass数据中查看Fe属性,并进行离散化分析
解答:
-
导入glass数据集,并查看Fe(铁)元素属性,操作结果如下图:

-
我们选用的是无监督离散化方法,首先,我们使用其默认的离散化设置,即等宽离散化方法,结果如下图所示:

-
接着我们使用等频的离散化方法,将useEqualFrequency改为True,操作结果如下图所示:

-
进一步分析:一般情况下,等频离散化后直方图大致等高,而

本文介绍了使用WEKA工具对weather和glass数据集进行数据预处理,包括添加新属性、离散化分析。针对weather数据,通过AddUserFields和AddValues过滤器添加了Mode属性并填充值。对于glass数据,查看了Fe属性并尝试了等宽和等频离散化,分析了离散化对处理数值型属性的影响。离散化能够提高学习算法的效果。
最低0.47元/天 解锁文章
496

被折叠的 条评论
为什么被折叠?



