一个服务器希望知道客户主机是否崩溃并关机或者崩溃并又重新启动。许多实现提供的保活定时器可以提供这种能力。
保活定时器就是试图在服务器端检测到这种半开放的连接。
1.TCP保活定时器
如果一个给定的连接在两个小时之内没有任何动作,则服务器向客户发送一个探查报文段。客户主机必须处于以下四个状态之一。
1.客户主机依然正常运行,并从服务器可达。客户的TCP响应正常,而服务器也知道对方是正常工作的。服务器在两个小时以后将保活定时器复位。如果在两个小时定时器到时间之前有应用程序的通信量通过此连接,则定时器在交换数据后的未来2小时在复位
2.客户主机已经崩溃,并且关闭或者正在重新启动。服务器不能收到对探查的响应,并在75秒后超时。服务器总共发送10个这样的探查,每个间隔75秒。如果服务器没有收到一个响应,他就认为客户主机已经关闭并且终止连接(返回连接超时的错误)
3.客户主机崩溃并且已经重启。这时服务器收到一个对其保活探查的响应,但是这个响应是一个复位,使得服务器终止这个连接(返回“连接被对端复位”的差错)
4.客户主机正常运行,但是从服务器不可达。这与状态2相同,因为TCP不能够区分状态4与状态2的区别,他所能发现的就是没有收到探查的响应。
在第一种情况下,应用程序没有感觉到保活探查的发生。TCP层负责这一切
保活定时器的缺点:
可能由于一个临时性的网络中断而引起一个非常好的连接断开;