文件的存储路径分别为:ExperimentEvaluation\\level2\\mfo\\oprationname\\errorrate\\MRname\\dataname\\programname\\fo_dataname_output,ExperimentEvaluation\\level2\\mso\\oprationname\\errorrate\\\dataname\\programname\\so_dataname_output,包含要处理的每个数据集的行号分别存储在txt文件中,分为so和fo两个文件夹存储,每个文件以e1_row_to_change~e10_row_to_change命名
写完代码后,发现结果并不是预期的:
通过设置断点以及打印输出中间结果,发现so的结果中,出现的问题本应该出现在e10的结果出现在了e1中,而本应该出现在e1中的结果出现在了e2中,以此类推,对应如下:
而fo的变异结果除了出现上述问题还有一个问题,即MR1应该对变异的数据集的处理是符合应该处理的行号,而MR2应该变异的数据集的处理却是MR10中的数据集应该处理的行号,MR3应该变异的数据集的处理是MR2中的数据集应该处理的行号,……,MR10应该变异的数据集的处理是MR9中的数据集应该处理的行号。
最开始对这个bug完全不知道是为什么,关注点只在代码本身的编写和逻辑是否出现错误,但是不论是自己还是请经验比较丰富的师兄反复检查都发现代码完全没有任何问题。最后是自己利用断点和中间结果输出才发现了读文件和文件夹的顺序完全不是自己的预期,对于txt文件,先读10,再读1,2……,9;而对于文件夹则是先读1,然后读10,2,3,……,9。这是因为在Java中是将所有的数据都转换成ASCII码处理的,但是因为自己这个小细节而导致出现了这样一个让大家都想不到原因的bug。所以今后对文件和文件夹命名的时候应该注意这个问题,像“10”就可以用十六进制的“A”来代替。