按字节读取txt文件缓存区大小设置多少比较好?

通过实验对比不同字节缓存大小对文件读取效率的影响,得出结论:对于小文件,一次性读取更优;对于大文件,建议使用1MB缓存进行读取。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

读取 txt 文件常规写法有逐行读取和按照字节缓存读取,那么按照字节缓存读取时,设置缓存区多大比较好呢?百度了一下,没发现有说这个问题的,自测了一把,以事实说话。

常规读取方法如下:

// 字节流读取
try(InputStream in = new FileInputStream("test.txt")) 
{
    byte[] readBuffer = new byte[1024];
    while(in.available() > 0) 
    {
        in.read(readBuffer);
    }
} catch (Exception e) {
    
}

我的 test.txt 文件大小为 200k,按照每次读取 1024字节,执行 3 次分别耗时:893110、880807、1202766  纳秒

按照每次读取 1024 * 1024 来读取,执行 3 次分别耗时:1028437、1260876、800448 纳秒

直接一次性读完(new byte[in.available()]),执行 3 次分别耗时:515134、265682、835523

如上3种方式,貌似缓存区间越大越好,事实是不是这样呢?我们将文件扩大20倍左右(3826k),按顺序分别执行 3 次。

每次读取 1024字节:15811857、16539536、17310929;

每次读取 1024 * 1024字节:4509521、3230585、3017516;

直接一次性读完(new byte[in.available()]):9265355、5899443、4731228

每次读取 1024 * 1024 * 1024字节:938333314、489835646、505372921

总结:
I/O字节读取缓冲区不宜设置过大,根据实际业务场景来,如果文件大部分小于1M,一次性读取完即可,大于 1M 的还是按照 1M每次读取比较好。小伙伴们觉得呢?

 

申明:原文发表在优快云(https://blog.youkuaiyun.com/kuloujianzun/article/details/84134786),但因为优快云广告太多,迁移至博客园。

转载于:https://www.cnblogs.com/xsbx/p/11429655.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值