客户端的心跳检测对于任何长连接的应用来说,都是一个非常基础的功能。要理解心跳的重要性,首先需要从网络连接假死的现象说起。
一、网络连接假死现象
什么是连接假死呢?如果底层的TCP连接已经断开,但是服务器端并没有正常地关闭套接字,认为这条连接仍然是存在的。
连接假死的具体表现如下:
- 在服务器端,会有一些处于TCP_ESTABLISHED状态的正常连接
- 在客户端,TCP客户端已经显示连接已经断开
- 客户端此时虽然可以进行断线重连操作,但是上一次连接状态依然被服务器端认为有效,并且服务器端的资源得不到正确释放,包括套接字上下文以及接受/发送缓冲区
连接假死的情况虽然不常见,但是确实存在。服务器端长时间运行后,会面临大量假死连接得不到释放的情况。由于每个连接都会消耗CPU和内存资源,因此大量假死的连接会逐渐耗光服务器的资源,使得服务器越来越慢,IO处理效率越来越低,最终导致服务器崩溃。
连接假死通常是由多个原因造成的:
- 应用程序出现线程堵塞,无法进行连接的读写
- 网络相关的设别出现故障
- 网络丢包
解决假死的有效手段是客户端定时进行心跳检测,服务端定时进行空闲检测。
二、服务器端的空闲检测
想解决假死问题,服务器端的有效手段是空闲检测。所谓空闲检测就是每隔一段时间监测子通道是否有数据读写,如果有则子通道是正常的,如果没有则判定为假死,关闭子通道。
服务器端实现空闲检测只需要使用Netty自带的IdleStateHandler空闲状态处理器就可以实现这个功能。
@Slf4j
public class HeartBeatServerHandler extends IdleStateHandler {
private static final int READ_IDLE_GAP = 150; // 最大空闲时间(s)
public HeartBeatServerHandler() {
super(READ_IDLE_GAP, 0, 0, TimeUnit.SECONDS);
}
@Override
protected void channelIdle(ChannelHandlerContext ctx, IdleStateEvent evt) throws Exception {
log.info("{}秒内未读到数据,关闭连接", READ_IDLE_GAP);
// 其他处理,如关闭会话
}
@Override
public void channelRead(ChannelHandlerContext ctx, Object msg) throws Exception

本文介绍了网络连接假死现象,探讨了服务器端通过IdleStateHandler进行空闲检测以解决连接假死问题,同时强调了客户端定时发送心跳报文的重要性,以确保双方资源的有效管理并防止服务器崩溃。
最低0.47元/天 解锁文章
588

被折叠的 条评论
为什么被折叠?



