Java IO读写大文件的几种方式及测试

本文对比了四种不同的Java大文件读取方法:OldIO、NewIO、RandomAccessFile及MappedByteBuffer,并详细记录了每种方法的实现过程及耗时。通过实验发现,使用内存映射文件的方式效率最高。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >


读取文件大小:1.45G

第一种,OldIO:

public static void oldIOReadFile() throws IOException{          BufferedReader br = new BufferedReader(new FileReader("G://lily_947.txt"));          PrintWriter pw = new PrintWriter("G://oldIO.tmp");          char[] c = new char[100*1024*1024];          for(;;){              if(br.read(c)!=-1){                  pw.print(c);              }else{                  break;              }          }          pw.close();          br.close();      }

耗时70.79s


第二种,newIO:  

public static void newIOReadFile() throws IOException{      FileChannel read = new RandomAccessFile("G://lily_947.txt","r").getChannel();      FileChannel writer = new RandomAccessFile("G://newIO.tmp","rw").getChannel();      ByteBuffer bb = ByteBuffer.allocate(200*1024*1024);      while(read.read(bb)!=-1){          bb.flip();          writer.write(bb);          bb.clear();      }      read.close();      writer.close();                }

耗时47.24s


第三种,RandomAccessFile:

public static void randomReadFile() throws IOException{         RandomAccessFile read = new RandomAccessFile("G://lily_947.txt","r");         RandomAccessFile writer = new RandomAccessFile("G://random.tmp","rw");         byte[] b = new byte[200*1024*1024];         while(read.read(b)!=-1){            writer.write(b);         }         writer.close();         read.close();  }

耗时46.65


第四种,MappedByteBuffer:

public static void mappedBuffer() throws IOException{     FileChannel read = new FileInputStream("G://lily_947.txt").getChannel();     FileChannel writer = new RandomAccessFile("G://buffer.tmp","rw").getChannel();     long i = 0;     long size = read.size()/30;     ByteBuffer bb,cc = null;     while(i<read.size()&&(read.size()-i)>size){         bb = read.map(FileChannel.MapMode.READ_ONLY, i, size);         cc = writer.map(FileChannel.MapMode.READ_WRITE, i, size);         cc.put(bb);         i+=size;         bb.clear();         cc.clear();      }      bb = read.map(FileChannel.MapMode.READ_ONLY, i, read.size()-i);      cc.put(bb);      bb.clear();      cc.clear();      read.close();      writer.close();   }

耗时:36


前三种读法可以通过jconsole得到资源占用图。

相对于最后一种内存直接映射方式前面的测试其实无意义,基本秒杀。。。。。

对于很大的文件直接分块映射时内存会不够,这是因为MappedByteBuffer未被释放造成的,sun未提供直接回收MappedByteBuffer区域的方法,这个时候有两种方法解决,第一种比较愚笨的:

      System.gc();       System.runFinalization();       try {          Thread.sleep(3000);      } catch (InterruptedException e) {                    e.printStackTrace();      }

第二种网上找来的,利用反射调用clean方法:

public static void unmap(final MappedByteBuffer buffer) {if (buffer == null) {return;}AccessController.doPrivileged(new PrivilegedAction<Object>() {public Object run() {try {Method getCleanerMethod = buffer.getClass().getMethod("cleaner", new Class[0]);if (getCleanerMethod != null) {getCleanerMethod.setAccessible(true);Object cleaner = getCleanerMethod.invoke(buffer,new Object[0]);Method cleanMethod = cleaner.getClass().getMethod("clean", new Class[0]);if (cleanMethod != null) {cleanMethod.invoke(cleaner, new Object[0]);}}} catch (Exception e) {e.printStackTrace();}return null;}});}

以上两种方法感觉都别扭,还有就是可以自己分割成物理文件再循环调用,这个也不太美观。

速度也会减慢好多。 


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值