最近在做产品的老化测试,大体的方法是让产品长时间跑,数据由网络发出,PC端插入网线,则收到产品的数据,看是否正确,拔掉网线,产品端产生的数据则抛空,产品继续长时间运行。
想到的实现方法是产品做服务端,PC做客户端。在产品端重新实现open write close,在open中起子线程监听连接。write中如果有有效连接则写到socket中,无效连接则直接返回。
这样存在的一个问题是对于客户端的暴力关闭,也就是直接拔掉网线,服务器端如何检测。
也就是socket连接的一端如何知道连接已经被动关闭,如另一端强退,另一端close等?
想到的方法是利用write函数,失败说明拔掉网线,将描述符置为无效,监听子进程中再继续监听,知道有新的connect。
为了测试这种情况,写了简单客户端,connect server之后直接关掉,而这时server端accept后就开始write了,就可以模拟直接拔掉网线。
但是实际的测试结果是,server write 一部分数据之后,第二次write剩余数据时,程序直接退出了!

在进行产品老化测试时,通过socket通信,当客户端突然断开连接时,服务器端write操作会触发SIGPIPE信号导致程序退出。原因是socket连接断开后,继续尝试write会引发该信号。解决方案是忽略SIGPIPE信号,使write返回错误,从而检测到连接已断开。本文介绍了问题的出现、原因及如何通过strace调试,并强调了掌握解决问题的方法比了解问题本身更重要。
最低0.47元/天 解锁文章
3846

被折叠的 条评论
为什么被折叠?



