
weka机器学习与数据挖掘
以weka为主进行机器学习和数据挖掘
旋转梅花桩
这个作者很懒,什么都没留下…
展开
-
机器学习之用二分类学习器解决多分类问题
利用二分类学习器解决多分类问题拆分策略(1)一对一拆分阶段,N个类两两配对,共N(N-1)/2个二类任务,学习N(N-1)/2个二分类器。测试阶段,首先将待测样本提交给所有二分类器预测,得到N(N-1)/2个分类结果,然后投票产生最终的分类结果。即被预测最多的类标记作为最终的分类结果。(2)一对其余拆分阶段,分别将原始的N个类别中某一类作为正例,其余类作为反例,学习N个二类分类器测试阶段,将待测样本提交给所有的分类器预测,得到N个分类结果。若仅有一个分类器预测为正类,则对应类别为最终的分类结果原创 2020-11-16 18:54:47 · 2160 阅读 · 0 评论 -
weka机器学习-05-聚类
Weka中使用Cluster标签页来处理聚类问题。页面中各项的使用方法与Classify几乎一样。不同之处:(1)Cluster标签页左侧Clusterer mode(聚类器模式)选项组中Classes to clusters evaluation(类别作为簇的评估准则):比较所选择的簇与预先指定的数据类别的匹配程度。选项下方有一个下拉列表框,其操作与Classify标签页选择类别属性的操作一样。Store clusters for visualization(可视化保存簇):选中此复选框,在训练原创 2020-11-06 13:33:54 · 944 阅读 · 0 评论 -
weka机器学习-04-分类
分类是预测离散的值回归是预测连续的值1.分类器的选择Weka提供Classify标签页来构建分类器。Classify标签页最上面有Classifier(分类器)选项组,使用方法和Preprocess标签页Filter(过滤器)选项组一直,详情见上一篇博客。过滤器选项组使用方法Classify标签页左部有Test options(测试选项)选项组。用于设置测试模式,并将设置的选项应用到当前选择的分类器中,测试模式有:(1)Use training set(使用训练集):直接将训练集实例用于测试(原创 2020-11-06 12:57:24 · 3109 阅读 · 1 评论 -
weka机器学习-03-探索者(Explorer)界面及数据预处理
点击主界面的Explorer按钮后,显示界面Explorer界面:初始打开时,只有Preprocess标签可以用1.各个标签用途(1)Preprocess(预处理):选择数据集,以不同方式对其进行修改。(2)Classify(分类):训练用于分类或回归的学习方案,并对其进行评估。(3)Cluster(聚类):学习数据集聚类方案。(4)Associate(关联):学习数据关联规则,并对齐进行评估。(5)Select attributes(选择属性):选择数据集中预测效果最好的部分属性。(6)原创 2020-11-04 20:52:37 · 3882 阅读 · 0 评论 -
weka机器学习-02-weka初步使用
weka主界面如下:1.Program(编排)菜单(1)LogWindow(日志窗口):打开一个记录输出到stdout或stderr内容的日志窗口。windows环境下,如果以不带控制台输出的方式启动,日志窗口比较游泳。(2)Memory usage(内存使用情况):打开一个显示内存使用情况的窗口,如果用户发现内存占用过大,可单击窗口右边的GC按钮,启动垃圾回收器。(3)Exit(退出):关闭WeKa2.Visualization(可视化)菜单(1)Plot(散点图):画出数据集的二维散点图;原创 2020-11-02 20:33:13 · 2546 阅读 · 0 评论 -
weka机器学习-01-weka简介及基本概念
1.weka主界面各个功能键概述Explorer(探索者):最容易使用的图形用户界面,通过菜单和填写表单可以调用weka的所有功能。缺陷:要求将所需数据全部依次读进内存,一旦用户打开某个数据集,就会批量读取全部数据。因此,这种批量方式仅适合处理中小规模问题。KnowledgeFlow(知识流):可以使用增量方式的算法来处理大规模的数据集,无需一次性全部导入。Experimenter(实验者):对于一个已知问题,哪种方法及参数值能够取得最佳效果。即可以用于进行多种算法性能的比较。2.基本概念2.原创 2020-11-02 19:24:51 · 3656 阅读 · 0 评论