OS的安全性等的考虑,进程是无法直接操作I/O设备的,其必须通过系统调用请求内核来协助完成I/O动作,而内核会为每个I/O设备维护一个buffer。如下图
流程:用户发送请求→内核接受请求→I/O获取数据到Buffer,将Buffer中的数据copy到用户进程空间中的地址空间,用户得到数据后再返回客户端。
大概了解下I/O的五种模式:
阻塞I/O (Blocking I/O)
非阻塞I/O (Non-Blocking I/O)
I/O复用(I/O Multiplexing)
信号驱动的I/O (Signal Driven I/O)
异步I/O (Asynchrnous I/O)
在NIO中有几个比较关键的概念:Channel(通道),Buffer(缓冲区),Selector(选择器)。
(1)Channel(通道),在传统IO中我们要读取一个文件中的内容时InputStream实际上就是为读取文件提供了一个通道,因此可以将NIO 中的Channel同传统IO中的Stream来类比。但是要注意的是,传统IO中的Stream是单向的,比如InputStream只能进行读取操作,OutputStream只能进行写操作;而Channel是双向的,既可用来进行读操作又可用来进行写操作。
以下是常用的几种通道,以及使用第一种写文件的例子。
FileChannel //可以从对文件进行读写数据
SocketChanel //以TCP向网络连接的两端读写数据
DatagramChannel //以UDP协议向网络连接的两端读写数据
ServerSocketChannel //监听客户端发起的TCP连接,并为每个连接创建新的SocketChannel来进行数据读写
File file = new File("C:/test.txt");
FileOutputStream outputStream = new FileOutputStream(file);
FileChannel channel = outputStream.getChannel();
ByteBuffer buffer = ByteBuffer.allocate(1024);
String string = "NIO";
buffer.put(string.getBytes());
buffer.flip();
channel.write(buffer);
(2)Buffer(缓冲区),实际上是一个容器,是一个连续数组,在NIO中所有数据的读和写都必须经由Buffer。
在NIO中,Buffer是一个顶层父类,它是一个抽象类。
常用的Buffer的子类有:ByteBuffer、IntBuffer、CharBuffer、LongBuffer、DoubleBuffer、FloatBuffer、ShortBuffer。
如果是对于文件读写,上面几种Buffer都可能会用到。但是对于网络读写来说,用的最多的是ByteBuffer。
使用Buffer读写数据一般遵循以下四个步骤:
- 写入数据到Buffer
- 调用
flip()
方法 - 从Buffer中读取数据
- 调用
clear()
方法或者compact()
方法
当向buffer写入数据时,buffer会记录下写了多少数据。一旦要读取数据,需要通过flip()方法将Buffer从写模式切换到读模式。在读模式下,可以读取之前写入到buffer的所有数据。
一旦读完了所有的数据,就需要清空缓冲区,让它可以再次被写入。有两种方式能清空缓冲区:调用clear()或compact()方法。clear()方法会清空整个缓冲区。compact()方法只会清除已经读过的数据。任何未读的数据都被移到缓冲区的起始处,新写入的数据将放到缓冲区未读数据的后面。
//读写文件
RandomAccessFile afile = new RandomAccessFile("D:\\1.txt","rw");
//获取文件管道
FileChannel fileChannel= afile.getChannel();
//获取一个Buffer对象,分配48字节的容量
ByteBuffer buf = ByteBuffer.allocate(48);
//向Buffer写入数据,从channel写到Buffer
int bytesRead = fileChannel.read(buf);
while (bytesRead != -1){
System.out.println("Read"+bytesRead);
//将Buffer从写切换为读
buf.flip();
while (buf.hasRemaining()){
//把从Buffer中读出Channel
System.out.print(((char) buf.get()));
}
buf.clear();
bytesRead = fileChannel.read(buf);
}
afile.close();
- capacity容量
- position位置
- limit上限
position和limit的含义取决于Buffer处在读模式还是写模式。不管Buffer处在什么模式,capacity的含义总是一样的。
这里有一个关于capacity,position和limit在读写模式中的说明,详细的解释在插图后面。
capacity
作为一个内存块,Buffer有一个固定的大小值,也叫“capacity”.你只能往里写capacity个byte、long,char等类型。一旦Buffer满了,需要将其清空(通过读数据或者清除数据)才能继续写数据往里写数据。
position
当你写数据到Buffer中时,position表示当前的位置。初始的position值为0.当一个byte、long等数据写到Buffer后, position会向前移动到下一个可插入数据的Buffer单元。position最大可为capacity – 1.
当读取数据时,也是从某个特定位置读。当将Buffer从写模式切换到读模式,position会被重置为0. 当从Buffer的position处读取数据时,position向前移动到下一个可读的位置。
limit
在写模式下,Buffer的limit表示你最多能往Buffer里写多少数据。 写模式下,limit等于Buffer的capacity。
当切换Buffer到读模式时, limit表示你最多能读到多少数据。因此,当切换Buffer到读模式时,limit会被设置成写模式下的position值。换句话说,你能读到之前写入的所有数据(limit被设置成已写数据的数量,这个值在写模式下就是position)
Buffer的类型
Java NIO 有以下Buffer类型
- ByteBuffer
- MappedByteBuffer
- CharBuffer
- DoubleBuffer
- FloatBuffer
- IntBuffer
- LongBuffer
- ShortBuffer
rewind()方法
一旦读完Buffer中的数据,需要让Buffer准备好再次被写入。可以通过clear()或compact()方法来完成。
如果调用的是clear()方法,position将被设回0,limit被设置成 capacity的值。换句话说,Buffer 被清空了。Buffer中的数据并未清除,只是这些标记告诉我们可以从哪里开始往Buffer里写数据。
如果Buffer中有一些未读的数据,调用clear()方法,数据将“被遗忘”,意味着不再有任何标记会告诉你哪些数据被读过,哪些还没有。
如果Buffer中仍有未读的数据,且后续还需要这些数据,但是此时想要先先写些数据,那么使用compact()方法。
compact()方法将所有未读的数据拷贝到Buffer起始处。然后将position设到最后一个未读元素正后面。limit属性依然像clear()方法一样,设置成capacity。现在Buffer准备好写数据了,但是不会覆盖未读的数据。
mark()与reset()方法
通过调用Buffer.mark()方法,可以标记Buffer中的一个特定position。之后可以通过调用Buffer.reset()方法恢复到这个position。例如:
buffer.mark();
//call buffer.get() a couple of times, e.g. during parsing.
buffer.reset(); //set position back to mark.
flip方法将Buffer从写模式切换到读模式。调用flip()方法会将position设回0,并将limit设置成之前position的值。
可以使用equals()和compareTo()方法两个Buffer。
equals()
当满足下列条件时,表示两个Buffer相等:
- 有相同的类型(byte、char、int等)。
- Buffer中剩余的byte、char等的个数相等。
- Buffer中所有剩余的byte、char等都相同。
如你所见,equals只是比较Buffer的一部分,不是每一个在它里面的元素都比较。实际上,它只比较Buffer中的剩余元素。
compareTo()方法
compareTo()方法比较两个Buffer的剩余元素(byte、char等), 如果满足下列条件,则认为一个Buffer“小于”另一个Buffer:
- 第一个不相等的元素小于另一个Buffer中对应的元素 。
- 所有元素都相等,但第一个Buffer比另一个先耗尽(第一个Buffer的元素个数比另一个少)。
//读写文件
RandomAccessFile afile = new RandomAccessFile("D:\\1.txt","rw");
//获取文件管道
FileChannel fileChannel= afile.getChannel();
//获取一个Buffer对象,分配48字节的容量
ByteBuffer buf = ByteBuffer.allocate(48);
//向Buffer写入数据,从channel写到Buffer
int bytesRead = fileChannel.read(buf);
while (bytesRead != -1){
System.out.println("Read"+bytesRead);
//将Buffer从写切换为读
buf.flip();
while (buf.hasRemaining()){
//把从Buffer中读出Channel
System.out.print(((char) buf.get()));
}
buf.clear();
bytesRead = fileChannel.read(buf);
}
afile.close();
(3)Selector,可以理解为通道管理器,用单线程处理一个Selector以轮询每个注册的Channel,通过Selector.select()方法来获取到达事件(一个SelectionKey表示一个到达的事件),一旦发现Channel有注册的事件发生,便可以逐个地对这些事件进行处理。
仅用单个线程来处理多个Channels的好处是,只需要更少的线程来处理通道。事实上,可以只用一个线程处理所有的通道。对于操作系统来说,线程之间上下文切换的开销很大,而且每个线程都要占用系统的一些资源(如内存)。因此,使用的线程越少越好。但是,需要记住,现代的操作系统和CPU在多任务方面表现的越来越好,所以多线程的开销随着时间的推移,变得越来越小了。实际上,如果一个CPU有多个内核,不使用多任务可能是在浪费CPU能力。