项目需要数据挖掘算法,想到weka平台的API里有现成的,于是自己写数据转换接口。
原本的数据格式:
参照weka平台提供的arff数据格式
直接上代码:
header存储列名,value存储每一行数据信息,set保存数据出现的分类类别的集合
List<String> header = new ArrayList<>();
List<String> value = new ArrayList<>();
Set<String> set = new HashSet<>();
while (null != (strLine = bufferedReader.readLine())){
if (lineCnt == 0) {
String[] s = strLine.split(",");
header.addAll(Arrays.asList(s));
}else {