
Data Mining
文章平均质量分 59
Shellerine
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
weka中Apriori算法实现与分析
转载出处:http://blog.youkuaiyun.com/marelin/article/details/17503477一、Apriori算法参数含义本次共进行了9组实验,使用了weka安装目录data文件夹下的contact-lenses.arff数据。 ToolsàArffViewer,打开contact-lenses,可以看到实验数据contact-lens转载 2016-11-16 21:00:52 · 8117 阅读 · 0 评论 -
weka连接mysql
前提条件是已经安装了Weka,并且下载好了mysql-connector-java-5.1.15-bin.jar文件放在了Weka-3-6下面的lib文件夹中了。软件版本,jar包版本根据个人的来选择。1.到weka安装目录下去找到weka.jar,解压weka.jar文件到当前文件夹,打开weka文件夹中的experiment文件夹。2.删除DatabaseUtils.props,将Databa转载 2016-11-11 20:02:29 · 632 阅读 · 0 评论 -
weka中的arff格式数据
1.数据格式主要有三个要求,@relation ,@attribute,@data这三个是要有的,文件的名称,实例的属性,以及实例属性的对应值@relation house @attribute houseSize numeric@attribute lotSize numeric@attribute bedrooms numeric@attribute granite n原创 2016-11-15 20:36:09 · 3732 阅读 · 0 评论 -
weka进行十折交叉验证
十折交叉验证英文名叫做10-fold cross-validation,用来测试算法准确性。是常用的测试方法。将数据集分成十分,轮流将其中9份作为训练数据,1份作为测试数据,进行试验。每次试验都会得出相应的正确率(或差错率)。10次的结果的正确率(或差错率)的平均值作为对算法精度的估计,一般还需要进行多次10折交叉验证(例如10次10折交叉验证),再求其均值,作为对算法准确性的估计。之所以选择将数转载 2016-11-22 09:05:47 · 9488 阅读 · 0 评论 -
weka中的混淆矩阵
Confusion Metrix1.在人工智能中,混淆矩阵(confusion matrix)是可视化工具,特别用于监督学习,在无监督学习一般叫做匹配矩阵。2.如有150个样本数据,这些数据分成3类,每类50个。分类结束后得到的混淆矩阵为: 预测类1类2类3实际类1转载 2016-11-22 21:34:45 · 4906 阅读 · 0 评论 -
用weka做数据分析 回归分析
回归回归是最为简单易用的一种技术,但可能也是最不强大(这二者总是相伴而来,很有趣吧)。此模型可以简单到只有一个输入变量和一个输出变量(在 Excel 中称为 Scatter 图形,或 OpenOffice.org 内的 XYDiagram)。当然,也可以远比此复杂,可以包括很多输入变量。实际上,所有回归模型均符合同一个通用模式。多个自变量综合在一起可以生成一个结果 — 一个因变量。然后用回转载 2016-11-17 15:18:46 · 9350 阅读 · 0 评论 -
weka中的zeroR算法
ZeroR分类器是一种最简单的分类器,这种方法仅仅根据历史数据统计规律,而选择一种概率最大的类别作为未知样本的分类结果,也就是说对于任意一个未知样本,分类结果都是一样的。ZeroR分类器简单的以多数类的类别(连续型数据使用简单均值)作为预测值。尽管这种分类器没有任何的预测能力,但是它可以作为一种与其他分类器的对比分类器。也就是说baseline performance。算法描述转载 2016-12-09 18:34:34 · 5954 阅读 · 1 评论