
Weka
隆猫
这个作者很懒,什么都没留下…
展开
-
Weka-无监督属性过滤器-AddCopyAddid[6-1]
在weka中过滤器分为无监督过滤器和有监督过滤器两种,每种类型又细分为属性过滤器和实例过滤器,前者作用于数据中的属性,后者作用于数据集中的实例。有监督过滤器使用时,会出现以下情况:测试集数据在有监督过滤器使用时已经使用,必然造成如同先偷看答案再考试的效果。所以,对于模型的评价是有问题的。要合理地评估有监督离散化,最好使用weka的元学习器FilterClassifier。它仅使原创 2016-06-27 16:18:20 · 1625 阅读 · 0 评论 -
Weka文件读取及导出[1]
weka文件读取分3类,分别为:ARFF(weka自身文件读取),CSV(文本文件读取),数据库直接读取1,ARFF(weka自身文件读取),比较容易直接使用Instances类即可2,CSV文件读取需要使用dataSource类import java.io.BufferedReader;import java.io.FileReader;import w原创 2016-06-12 14:18:30 · 3921 阅读 · 0 评论 -
weka-Oracle数据库连接及以ARFF文件导出[2]
weka 在 eclipse 直接连接Oracle 取数据,需要修改weka包中的配置文件。在使用weka包连接数据库前,我们先研究 eclipse 如何连接oracle取数据1,eclipse 连接oracle取数据import java.sql.*;public class JDBCTest { public static void main(St原创 2016-06-12 15:32:17 · 964 阅读 · 0 评论 -
weka-mysql数据库连接及以ARFF文件导出[3]
mysql数据连接,由于mysql数据库支持数据类型的较多,会有些麻烦,但是总体而言,还是方便的。相似地,在使用weka包连接mysql前,我们先回顾如何java直接连接mysql数据库;1,eclipse连接mysql数据库(请先加载mysql-connector-java-5.1.18-bin.jar包)import java.sql.Connection;原创 2016-06-13 11:04:21 · 898 阅读 · 0 评论 -
Weka-无监督属性过滤器-AddExpressionMathExpression[6-2]
本部分延续上一篇的研究,接着2个方法:AddExpression,MathExpressionAddExpression过滤器是通过将一个数学函数应用于数值型属性而生成1个新的属性。其中,可以支持+、-、*、/、和^,函数log、abs、cos、exp、sqrt、floor、ceil、rint、tan、sin,属性通过索引加前缀a确定,例如a7表示第7个属性;MathE原创 2016-07-01 16:12:09 · 1178 阅读 · 0 评论 -
Weka-无监督属性过滤器-Interquartile[6-3]
我们继续第6篇的无监督属性过滤器的函数介绍。Interquartile,用以指示实例的值是否可以视为离群值或极端值。(具体演算,我们就不实验了)如果用户指定的极端值系数和四分位距的乘积值高于第75个四分位数之间的差,或低于第25个四分位数,该值就被标识为极端值。具体看代码,我们在代码中注释了各参数的含义:import java.io.BufferedReader原创 2016-07-01 16:36:03 · 2060 阅读 · 0 评论 -
Weka-Fliter类-选择属性变量[4]
在研究了weka如何导入导出数据后,根据制作数据模型的要求,我们需要对导入数据进入整理:整理数据包括:属性处理、样本处理、数据转换(生成新变量)本文先研究如何程序中选择属性,代码如下:import java.io.FileReader;import weka.core.Instances;import weka.filters.unsupervised.a原创 2016-06-16 10:01:14 · 1462 阅读 · 0 评论 -
Weka-filter类-选择样本[5]
接上文的思路,我们研究如何使用weka的方法,选择样本目前有3个方法可以研究下:RemovePercentage,RemoveRange,RemoveWithValuesRemovePercentage:顾名思义,根据百分比选择样本RemoveRange:根据序号选择样本RemoveWithValues:根据某字段的设定值选择样本然后,为减少原创 2016-06-16 10:59:34 · 680 阅读 · 0 评论