java循环遍历文件夹出现的bug记录

本文分享了一个关于Java中文件及文件夹读取顺序的Bug案例。作者在进行数据集正确性验证实验时,遇到文件读取顺序不符合预期的问题,最终发现是因为文件名和文件夹名的ASCII码排序导致。文章提供了宝贵的教训,提醒开发者注意文件命名可能导致的意外排序问题。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

最近在用java做检测数据集结果是否正确的实验,其中涉及了多个文件夹和文件,存储路径较为复杂。

文件的存储路径分别为:ExperimentEvaluation\\level2\\mfo\\oprationname\\errorrate\\MRname\\dataname\\programname\\fo_dataname_output,ExperimentEvaluation\\level2\\mso\\oprationname\\errorrate\\\dataname\\programname\\so_dataname_output,包含要处理的每个数据集的行号分别存储在txt文件中,分为so和fo两个文件夹存储,每个文件以e1_row_to_change~e10_row_to_change命名

写完代码后,发现结果并不是预期的:

通过设置断点以及打印输出中间结果,发现so的结果中,出现的问题本应该出现在e10的结果出现在了e1中,而本应该出现在e1中的结果出现在了e2中,以此类推,对应如下:


 

而fo的变异结果除了出现上述问题还有一个问题,即MR1应该对变异的数据集的处理是符合应该处理的行号,而MR2应该变异的数据集的处理却是MR10中的数据集应该处理的行号,MR3应该变异的数据集的处理是MR2中的数据集应该处理的行号,……,MR10应该变异的数据集的处理是MR9中的数据集应该处理的行号。

最开始对这个bug完全不知道是为什么,关注点只在代码本身的编写和逻辑是否出现错误,但是不论是自己还是请经验比较丰富的师兄反复检查都发现代码完全没有任何问题。最后是自己利用断点和中间结果输出才发现了读文件和文件夹的顺序完全不是自己的预期,对于txt文件,先读10,再读1,2……,9;而对于文件夹则是先读1,然后读10,2,3,……,9。这是因为在Java中是将所有的数据都转换成ASCII码处理的,但是因为自己这个小细节而导致出现了这样一个让大家都想不到原因的bug。所以今后对文件和文件夹命名的时候应该注意这个问题,像“10”就可以用十六进制的“A”来代替。



评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值