TCP的选项SO_LINGER设置延时关闭

本文探讨了SO_LINGER选项在服务器性能优化中的使用方法及其潜在风险,通过具体案例展示了如何避免引入TIME_WAIT状态,并提供了一种调整l_linger参数的方法以缩短TIME_WAIT状态时间。同时,强调了在应用此类TCP选项时需要进行充分测试的重要性,以确保服务器行为符合预期。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

SO_LINGER这个选项在我以前带队改造haproxy的时候引出过一个reset(RST)客户端连接的bug。

SO_LINGER作用
设置函数close()关闭TCP连接时的行为。缺省close()的行为是,如果有数据残留在socket发送缓冲区中则系统将继续发送这些数据给对方,等待被确认,然后返回。

利用此选项,可以将此缺省行为设置为以下两种
  a.立即关闭该连接,通过发送RST分组(而不是用正常的FIN|ACK|FIN|ACK四个分组)来关闭该连接。至于发送缓冲区中如果有未发送完的数据,则丢弃。主动关闭一方的TCP状态则跳过TIMEWAIT,直接进入CLOSED。网上很多人想利用这一点来解决服务器上出现大量的TIMEWAIT状态的socket的问题,但是,这并不是一个好主意,这种关闭方式的用途并不在这儿,实际用途在于服务器在应用层的需求。
  b.
将连接的关闭设置一个超时。如果socket发送缓冲区中仍残留数据,进程进入睡眠,内核进入定时状态去尽量去发送这些数据。
    在超时之前,如果所有数据都发送完且被对方确认,内核用正常的FIN|ACK|FIN|ACK四个分组来关闭该连接,close()成功返回。
    如果超时之时,数据仍然未能成功发送及被确认,用上述a方式来关闭此连接。close()返回EWOULDBLOCK。


SO_LINGER选项使用如下结构:

struct linger {

     int l_onoff;

     int l_linger;

};


l_onoff为0,则该选项关闭,l_linger的值被忽略,close()用上述缺省方式关闭连接。

l_onoff非0,l_linger为0,close()用上述a方式关闭连接。

l_onoff非0,l_linger非0,close()用上述b方式关闭连接。

值得一说的是,不管你用什么方式使用SO_LINGER,都需要大量耐心的测试来确保你的服务器程序确实是按照你的意愿在跑,因为这个选项对服务器处理小量请求的行为影响非常细微,简单的功能测试很难验证它的行为,上线后量大的情况下可能会出问题,让你的服务器马上下线,大并发量的模拟实际场景压测才能保证其正确性:)


1               慎用TCP的选项SO_LINGER

最近有一次性能测试,通讯程序出现错误,表现为服务器处理速度明显降低,检查发现服务器的很多句柄出于TIME_WAIT状态,Justin这个流氓的自己承认测试用例写的有问题,在recv函数返回0后,没有close句柄。

我很郁闷google了一下如何处理这类错误,发现了SO_LINGER这个选项,发现这个选项可以避免端口的状态进入TIME_WAIT状态,大胆的进行了一下测试。发现在性能测试中,服务器的表现好了不少,暗爽。

//使用SO_LINGER,close后不进入TIME_WAIT状态

struct linger linger;

linger.l_onoff = 1;

linger.l_linger = 0;

setsockopt(serverSocket,

  SOL_SOCKET, SO_LINGER,

  (const char *) &linger,

  sizeof(linger));

周3发版本,突然发现很多同事的都报告出现了一些错误,从客户端的日志反馈看,客户端在最后阶段往往没有收到几个我们的服务器的返回命令,于是立即想到了可能是这个选项导致了麻烦。注释这个选项后,果然大家的程序都正常了。

回头仔细读了一下《UNIX网络编程》卷1,才慢慢回想起来,TIME_WAIT的作用是保证在主动关闭端口后,保证数据让对端收到,Richard.Steven的原话是”TIME_WAIT是我们的朋友。”

由于我们客户端要和多个游戏服务器通讯,而且之间还有一些时序关系,所以我们不能使用这种让用户丢弃一部分数据的方式。对于TCP的细节感觉还是不熟悉,呵呵。

不能丢弃TIME_WAIT状态,但是让他缩短一些也是可以的。我们可以在l_linger参数上动点手脚,当l_onoff非0是。l_linge也非0的时候,套接口在TIME_WAIT上将拖延一段时间,l_linger秒,而不再是2MSL的超时[注]。我也打算继续试验一下。

 

【注】,根据《UNIX网络编程》卷1,需要注意的是,l_linger非0的解释在不同的平台可能不一样,BSD平台的实现是0.01s。


SO_LINGER是Linux套接字选项之一,它用于在套接字关闭时控制操作系统的行为。该选项可以通过setsockopt系统调用进行设置。 当SO_LINGER选项被启用时,我们可以指定一个超时时间。在套接字关闭时,如果有未发送的数据,操作系统会等待指定的超时时间,直到所有未发送的数据都被发送或超时时间到达。如果指定的超时时间为0,则操作系统会立即关闭套接字并丢弃未发送的数据。如果未启用SO_LINGER选项,则默认行为是立即关闭套接字并丢弃未发送的数据。 下面是SO_LINGER选项设置示例: ```c #include <sys/socket.h> int setsockopt(int sockfd, int level, int optname, const void *optval, socklen_t optlen); ``` 其中,sockfd是要设置选项的套接字文件描述符,level是选项的协议层,通常为SOL_SOCKET,optname是要设置选项名,这里是SO_LINGER,optval是指向选项值的指针,optlen是选项值的度。 以下是一个设置SO_LINGER选项的示例代码: ```c #include <sys/socket.h> #include <netinet/in.h> #include <netinet/tcp.h> int sockfd = socket(AF_INET, SOCK_STREAM, 0); struct linger so_linger; so_linger.l_onoff = 1; // 开启SO_LINGER选项 so_linger.l_linger = 5; // 超时时间为5秒 if (setsockopt(sockfd, SOL_SOCKET, SO_LINGER, &so_linger, sizeof(so_linger)) == -1) { perror("setsockopt"); exit(EXIT_FAILURE); } close(sockfd); ``` 在上面的示例中,我们创建了一个TCP套接字,并设置SO_LINGER选项的超时时间为5秒。如果在关闭套接字时有未发送的数据,操作系统会等待5秒钟,然后将未发送的数据丢弃。如果在5秒钟内所有数据都被发送,则立即关闭套接字。如果设置SO_LINGER选项失败,则会输出错误信息并退出程序。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值