
数据挖掘-Weka
文章平均质量分 91
梦想田园
用学习去充实自己,用实践去证明自己,用梦想去展现自己
展开
-
数据预处理和weka.filters的使用--数据挖掘学习和weka使用(三)
上一篇介绍了arff格式,这是weka专有格式,一般情况需要我们从其他数据源抽取或者获得。weka支持从cvs转化,也可以从数据库中抽取,界面如下图weka安装目录有一个data目录,里面有一些测试数据,可以用于测试和学习。导入了数据仅仅是一个开始,我们还需要对数据进行预处理。数据预处理(data preprocessing)数据预处理(data preprocessing转载 2015-05-10 14:53:09 · 2066 阅读 · 0 评论 -
Weka开发[-1]——在你的代码中使用Weka
你可能要用的最常用的组件(components)是:l Instances 你的数据l Filter 对数据的预处理l Classifiers/Clusterer 被建立在预处理的数据上,分类/聚类l Evaluating 评价classifier/clustererl Attribute selection 去除数据中不相关的属性下面将介绍如果在你自己的代码中使转载 2015-05-30 16:27:35 · 1705 阅读 · 0 评论 -
推荐数据挖掘入门教材《数据挖掘与机器学习 WEKA应用技术与实践》
该书由于去年刚出比较新,所以很难在网上下载到电子书,本人很幸运找到了前两章的电子版,而第二章又是本书的关键,所以建议大家先看看第二章,如果觉的写的好,可以再买书,或寻求电子版的全书,下载前两章请到:http://download.youkuaiyun.com/detail/u010968153/8686369原创 2015-05-19 08:55:19 · 3574 阅读 · 4 评论 -
Weka的聚类器SimpleKMeans中为什么还有distributionForInstance呢?
了解KM算法和EM算法的都知道,它们两个的区别就是,聚类分析完成后,KM将实例分到了每个簇里边,而EM并没有将每个实例分配给簇,而是计算出了每个实例属于每个簇的概率分布,而这个概率分布我们便可以通过方法distributionForInstance得到,然而KM却也有这个算法,不过它的概率取值只有1和0了原创 2015-05-24 12:07:30 · 1540 阅读 · 0 评论