为了解决同步阻塞I/O面临的一个链路需要一个线程处理的问题,后来有人对它的线程模型进行了优化,后端通过一个线程池来处理多个客户端的请求接入,形成客户端个数M:线程池最大线程数N的比例关系,其中M可以远远大于N,通过线程池可以灵活的调配线程资源,设置线程的最大值,防止由于海量并发接入导致线程耗尽。
伪异步I/O模型图
采用线程池和任务队列可以实现一种叫做伪异步的I/O通信框架,它的模型图如下:
当有新的客户端接入的时候,将客户端的Socket封装成一个Task(该任务实现java.lang.Runnable接口)投递到后端的线程池中进行处理,JDK的线程池维护一个消息队列和N个活跃线程对消息队列中的任务进行处理。由于线程池可以设置消息队列的大小和最大线程数,因此,它的资源占用是可控的,无论多少个客户端并发访问,都不会导致资源的耗尽和宕机。
伪异步式I/O创建的TimeServer源码分析
package com.phei.netty.io;
import java.io.IOException;
import java.net.ServerSocket;
import java.net.Socket;
import com.phei.netty.bio.TimeServerHandler;
public class TimeServer {
public static void main(String[] args) throws IOException {
int port = 8080;
if(args != null && args.length > 0){
try {
port = Integer.valueOf(args[0]);
} catch (NumberFormatException e) {
//采用默认值
}
}
ServerSocket server = null;
try {
server = new ServerSocket(port);
System.out.println("The time server is start in port : " + port);
Socket socket = null;
//创建IO任务线程池
TimeServerHandlerExecutePool singleExecutor =
new TimeServerHandlerExecutePool(50,10000);
while(true){
socket = server.accept();
singleExecutor.execute(new TimeServerHandler(socket));
}
} finally {
if(server != null){
System.out.println("The time server close");
server.close();
server = null;
}
}
}
}
伪异步I/O的主函数代码发生了变化,我们首先创建一个时间服务器处理类的线程池,当接收到新的客户端连接的时候,将请求Socket封装成一个Task,然后调用线程池的execute方法执行,从而避免了每个请求接入都创建一个新的线程。
伪异步I/O的Time ServerHandlerExecutePool
package com.phei.netty.io;
import java.util.concurrent.ArrayBlockingQueue;
import java.util.concurrent.ExecutorService;
import java.util.concurrent.ThreadPoolExecutor;
import java.util.concurrent.TimeUnit;
public class TimeServerHandlerExecutePool {
private ExecutorService executor;
public TimeServerHandlerExecutePool(int maxPoolSize,int queueSize){
executor = new ThreadPoolExecutor(Runtime.getRuntime().availableProcessors(),
maxPoolSize,
120L,
TimeUnit.SECONDS,
new ArrayBlockingQueue<java.lang.Runnable>(queueSize));
}
public void execute(java.lang.Runnable task) {
executor.execute(task);
}
}
伪异步I/O弊端分析
要对伪异步I/O的弊端进行深入分析,首先我们看两个Java同步I/O的API:java输入流InputStream和Java输出流OutputStream.
InputStream:
......
public int read(byte b[]) throws IOException {
return read(b,0,b.length);
}
当对Socket的输入流进行读取操作的时候,它会一直阻塞下支,直到发生如下三种事件:
有数据可读;
可用数据已经读取完毕;
发生空指针或者I/O异常;
这意味着当对方发送请求或者应答消息比较缓慢,或者网络传输比较慢时,读取输入流一方的通信线程将被长时间阻塞,如果对方要60s才能够将数据发送完成,读取一方的I/O线程也将会被同步阻塞60s,在此期间,其他接入消息只能在消息队列中排队。
下面我们接着对输出流OutputStream进行分析:
public void write(byte b[]) throws IOException;
当调用OutputStream的write方法写输出流的时候,它将会被阻塞,直到所有要发送的字节全部写入完毕,或者发生异常。学习过TCP/IP相关知识的人都知道,当消息的接收方处理缓慢的时候,将不能及时地从TCP缓冲区读取数据,这将会导致发送方的TCP window size不断减小,直到为0,双方处于Keep-Alive状态,消息发送方将不能再向TCP缓冲区写入消息,这时如果采用的是同步阻塞I/O,write操作将会被无限期阻塞,直到TCP window size大于0或者发生I/O异常。
通过对输入和输出流的API文档进行分析,我们了解到读和写操作都是同步阻塞的,阻塞的时间取决于对方I/O线程的处理速度和网络I/O的传输速度。
伪异步I/O实际上仅仅只是对之前I/O线程模型的一个简单优化,它无法从根本上解决同步I/O导致的通信线程阻塞问题。下面我们就简单分析下如果通信对方返回应答时间过长,会引起的级联故障:
服务端处理缓慢,返回应答消息耗费60s,平时只需要10s。
采用伪异步I/O的线程正在读取故障服务节点的响应,由于读取输入流是阻塞的,因此,它将会被同步阻塞60s。
假如所有的可用线程都被故障服务器阻塞,那后续所有的I/O消息都将在队列中排队。
由于线程池采用阻塞队列实现,当队列积满之后,后续入队列的操作将被阻塞。
由于前端只有一个Accptor线程接收客户端接入,它被阻塞在线程池的同步阻塞队列之后,新的客户端请求消息将被拒绝,客户端会发生大量的连接超时。
由于几乎所有的连接都超时,调用者会认为系统已经崩溃,无法接收新的请求消息。
如何破解这个难题?请看下节NIO!!