原因:
服务端在收到客户端发的大数据且进入到异常流程时候,没有释放锁,导致死锁。
死锁后就无法维持心跳,就会因为心跳超时断开连接,进入timewait状态。
客户端触发重连,重连后,服务端已连接队列里有新连接,
但是因为服务端套接字accept(接受连接)和处理连接是在一个线程里,所以该新连接一直在已连接队列中达不到处理,5秒后,客户端测到心跳超时,又触发重连。循环往复
定位方法:
gdb打印服务端套接字监听处理线程的调用栈,发现它死锁了
本文探讨了一种服务端在处理大数据时出现的死锁情况,当异常流程发生时,未能正确释放锁导致客户端连接断开并进入timewait状态。客户端尝试重连,但由于服务端的accept和处理在同一线程中,新连接无法得到及时处理,形成恶性循环。通过GDB调试,定位到服务端套接字监听处理线程的死锁调用栈,为问题诊断提供了方向。
原因:
服务端在收到客户端发的大数据且进入到异常流程时候,没有释放锁,导致死锁。
死锁后就无法维持心跳,就会因为心跳超时断开连接,进入timewait状态。
客户端触发重连,重连后,服务端已连接队列里有新连接,
但是因为服务端套接字accept(接受连接)和处理连接是在一个线程里,所以该新连接一直在已连接队列中达不到处理,5秒后,客户端测到心跳超时,又触发重连。循环往复
定位方法:
gdb打印服务端套接字监听处理线程的调用栈,发现它死锁了
3793

被折叠的 条评论
为什么被折叠?