select函数用法详解(以例子剖析)

本文详细介绍Unix系统下Berkeley Socket编程中的select()函数。通过实例演示如何利用select()监视多个文件描述符的状态变化,实现非阻塞式的高效编程。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

先看例子:
/* * This example opens a console and a serial port for * read mode, and calls select() with a 5 second timeout. * It waits for data to be available on either descriptor. */
#include <unistd.h>
#include <stdlib.h>
#include <fcntl.h>
#include <sys/select.h>
 
int main( void )
{
    int console, serial;
    struct timeval tv;
    fd_set rfd;
    int n;
    if( ( console = open( "/dev/con1", O_RDONLY ) ) == -1 || ( serial = open
      ( "/dev/ser1", O_RDONLY ) ) == -1 )
   {
        perror( "open" );
        return EXIT_FAILURE;
   }
  /*
  * Clear the set of read file descriptors, and
  * add the two we just got from the open calls.
  */
      FD_ZERO( &rfd );// 清除描述词组rfd的全部位,否则不能检测描述符变化。
      FD_SET( console, &rfd );// 设置描述词组rfd中相关console的位(即将console描述符添加到描述符
                                集rfd中)
      FD_SET( serial, &rfd ); //将serial描述符添加到rfd中,并设置相关位。 当描述符有变化时此相关位
                               会相应的变化,FD_ISSET通过此相关位捕捉到这种变化。
  /* * Set a 5 second timeout. */
      tv.tv_sec = 5;
      tv.tv_usec = 0;
/*select函数轮询所有描述符, 执行成功则返回文件描述词状态已改变的个数,如果返回0代表在描述词状态改变前已超过timeout时间,当有错误发生时则返回-1,错误原因存于errno,此时参数readfds,writefds,exceptfds和timeout的值变成不可预测。*/
      switch ( n = select( 1 + max( console, serial ), &rfd, 0, 0, &tv ) )
      {
        case -1:
          perror( "select" );
          return EXIT_FAILURE;
        case 0:
          puts( "select timed out" );
          break;
        default:
          printf( "%d descriptors ready ...\n", n );
          if( FD_ISSET( console, &rfd ) )// 用来测试描述词组rfd中相关console的位是否为真,为真则
                                           console描述符状态有变化
          puts( " -- console descriptor has data pending" );
          if( FD_ISSET( serial, &rfd ) )//同上
          puts( " -- serial descriptor has data pending" );
        }
    return EXIT_SUCCESS;
 }
 

select() 在 SOCKET 编程中还是比较重要的,可是对于初学 SOCKET 的人来说都不太爱用 select() 写程序,他们只是习惯写诸如 conncet()、accept()、recv() 或 recvfrom() 这样的阻塞程序(所谓阻塞方式 block,顾名思义,就是进程或是线程执行到这些函数时必须等待某个事件发生,如果事件没有发生,进程或线程就被阻塞,函数不能立即返回)。可是使用 select() 就可以完成非阻塞(所谓非阻塞方式 non-block,就是进程或线程执行此函数时不必非要等待事件的发生,一旦执行肯定返回,以返回值的不同来反映函数的执行情况。如果事件发生则与阻塞方式相同,若事件没有发生则返回一个代码来告知事件未发生,而进程或线程继续执行,所以效率高)方式工作的程序,它能够监视我们需要监视的文件描述符的变化情况——读写或是异常。下面详细介绍一下!

    select() 函数的格式(我所说的是 Unix 系统下的 Berkeley Socket 编程,和 Windows 下的有区别,一会儿说明):

    int select(int maxfdp, fd_set* readfds, fd_set* writefds, fd_set* errorfds, struct timeval* timeout);

    先说明两个结构体:

    第一:fd_set 可以理解为一个集合,这个集合中存放的是文件描述符(file descriptor),即文件句柄,这可以是我们所说的普通意义的文件,当然 Unix 下任何设备、管道、FIFO 等都是文件形式,全部包括在内,所以,毫无疑问,一个 socket 就是一个文件,socket 句柄就是一个文件描述符。fd_set 集合可以通过一些宏由人为来操作,比如清空集合:FD_ZERO(fd_set*),将一个给定的文件描述符加入集合之中 FD_SET(int, fd_set*),将一个给定的文件描述符从集合中删除 FD_CLR(int,   fd_set*),检查集合中指定的文件描述符是否可以读写 FD_ISSET(int, fd_set*)。一会儿举例说明。

    第二:struct timeval 是一个大家常用的结构,用来代表时间值,有两个成员,一个是秒数,另一个是微妙数(不是毫秒)。

    具体解释 select 的参数:

    int maxfdp 是一个整数值,是指集合中所有文件描述符的范围,即所有文件描述符的最大值加1,不能错!在 Windows 中这个参数值无所谓,可以设置不正确。

    fd_set* readfds 是指向 fd_set 结构的指针,这个集合中应该包括文件描述符,我们是要监视这些文件描述符的读变化的,即我们关心是否可以从这些文件中读取数据了,如果这个集合中有一个文件可读,select 就会返回一个大于 0 的值,表示可读取的文件数量,如果没有可读的文件,则根据 timeout 参数再判断是否超时,若超出 timeout 的时间,select 返回 0,若发生错误返回负值。这个参数也可以传入 NULL 值,表示不关心任何文件的读变化。

    fd_set* writefds 是指向 fd_set 结构的指针,这个集合中应该包括文件描述符,我们是要监视这些文件描述符的写变化的,即我们关心是否可以向这些文件中写入数据了,如果这个集合中有一个文件可写,select 就会返回一个大于 0 的值,表示可写入的文件数量,如果没有可写的文件,则根据 timeout 参数再判断是否超时,若超出 timeout 的时间,select 返回 0,若发生错误返回负值。这个参数也可以传入 NULL值,表示不关心任何文件的写变化。

    fe_set* errorfds 同上面两个参数的一样,用来监视文件错误异常。

    struct timeval* timeout 是 select 的超时时间,这个参数至关重要,它可以使 select 处于三种状态。

    第一:若将 NULL 以形参传入,即不传入时间结构,就是将 select 置于阻塞状态,一定等到监视文件描述符集合中某个文件描述符发生变化为止;

    第二:若将时间值设为 0 秒 0 微妙,就变成一个纯粹的非阻塞函数,不管文件描述符是否有变化,都立刻返回继续执行,文件无变化返回 0,有变化返回一个正值;

    第三:timeout 的值大于 0,这就是等待的超时时间,即 select 在 timeout 时间内阻塞,超时时间之内有事件到来就返回了,否则在超时后不管怎样一定返回,返回值同上述。

    返回值:

    负值:select错误

    正值:某些文件可读写或异常

    0:等待超时,没有可读写或错误的文件

阅读(357) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~
评论热议
<think>嗯,用户问的是select函数的功能详解。首先,我需要回忆一下select函数的基本概念和用途。记得select是用于I/O多路复用的,允许程序同时监控多个文件描述符的状态,比如可读、可写或异常。那用户可能是想了解它在网络编程中的应用,或者如何高效处理多个连接。 接下来,要确定用户的知识背景。如果用户是刚开始学习网络编程,可能需要从基础讲起,比如为什么需要多路复用,而不是用多线程或多进程。如果用户已经有经验,可能需要更深入的细节,比如select的限制和替代方案(如epoll或kqueue)。 然后,考虑到用户可能遇到的问题。比如select的效率问题,当监控大量文件描述符时性能下降,或者文件描述符数量的限制。用户可能想知道如何正确使用select,包括参数设置、返回值处理,以及常见错误。 还要分析用户可能的真实需求。他们可能正在编写一个需要处理多个客户端连接的服务器程序,想了解如何用select实现,或者优化现有的代码。这时候需要提供具体的示例和最佳实践,比如如何设置超时,如何处理阻塞和非阻塞套接字。 需要确保回答结构清晰,分点讲解select的功能、工作流程、优缺点,以及适用场景。同时,对比其他多路复用机制,帮助用户全面理解。另外,要注意使用用户容易理解的语言,避免过于专业的术语,或者至少解释清楚术语的含义。 可能还需要提到select在不同操作系统中的行为差异,比如Windows和Unix-like系统的区别。以及常见的使用陷阱,比如忘记重置fd_set导致的问题,或者最大文件描述符数的限制。 最后,总结select的适用情况,比如在连接数不高的情况下,select仍然是一个简单有效的选择,但在高并发场景下可能需要转向更高效的替代方案。这样用户可以根据自己的项目需求做出合适的选择。</think>以下是关于select函数的详细技术解析: --- ### 一、核心功能定位 `select`函数实现**I/O多路复用**机制,通过单一线程同时监控多个文件描述符的状态变化,主要检测三类事件: 1. **可读事件**(FD_ISSET(fd, &readfds)) 2. **可写事件**(FD_ISSET(fd, &writefds)) 3. **异常事件**(FD_ISSET(fd, &exceptfds)) 数学表达监控原理: $$ \text{Ready} = \{fd \in FDSET \mid \text{状态符合监控条件}\} $$ --- ### 二、函数原型解析 ```c int select(int nfds, fd_set *readfds, fd_set *writefds, fd_set *exceptfds, struct timeval *timeout); ``` 参数详解: - `nfds`: 监控的最大文件描述符+1(优化检测范围) - `readfds`: 可读描述符集合(输入输出参数) - `writefds`: 可写描述符集合(输入输出参数) - `exceptfds`: 异常描述符集合(输入输出参数) - `timeout`: 超时控制结构体 ```c struct timeval { long tv_sec; // 秒 long tv_usec; // 微秒 }; ``` --- ### 三、工作流程分解 1. **初始化集合** ```c fd_set read_set; FD_ZERO(&read_set); // 清空集合 FD_SET(sockfd, &read_set); // 添加描述符 ``` 2. **设置超时** ```c struct timeval tv = {5, 500000}; // 5.5秒超时 ``` 3. **调用select** ```c int ready = select(max_fd+1, &read_set, NULL, NULL, &tv); ``` 4. **结果处理** ```c if(FD_ISSET(sockfd, &read_set)){ // 处理可读事件 } ``` --- ### 四、关键技术特性 #### 1. 文件描述符上限 - Linux默认限制:1024(`FD_SETSIZE`定义) - 突破限制方案: ```c #define FD_SETSIZE 65536 #include <sys/select.h> // 需在包含头文件前定义 ``` #### 2. 时间复杂度分析 $$ O(n) \text{ 时间复杂度} $$ - 每次调用需线性遍历所有描述符 - 与epoll的$O(1)$复杂度形成对比 #### 3. 内核实现机制 - 采用**轮询检测**方式 - 数据从内核到用户的两次拷贝: ```mermaid graph LR A[用户空间fd_set] -->|copy| B[内核空间] B -->|检测| C[事件发生] C -->|copy| D[修改后的fd_set] ``` --- ### 五、典型应用场景 1. **TCP服务器模型** ```c while(1) { fd_set tmp_set = master_set; select(max_fd+1, &tmp_set, NULL, NULL, NULL); for(int fd=0; fd<=max_fd; fd++) { if(FD_ISSET(fd, &tmp_set)) { if(fd == listen_fd) { // 处理新连接 } else { // 处理客户端数据 } } } } ``` 2. **非阻塞IO配合使用** ```c fcntl(sockfd, F_SETFL, O_NONBLOCK); ``` 3. **定时任务触发** ```c struct timeval tv = {0, 100000}; // 100ms间隔 while(1) { select(0, NULL, NULL, NULL, &tv); // 执行定时任务 } ``` --- ### 六、缺陷与替代方案 #### 1. 主要缺陷 - 描述符数量限制 - 每次调用需重置监控集合 - 线性扫描效率低下 - 无法获取详细事件信息 #### 2. 现代替代方案对比 | 特性 | select | poll | epoll | |---------------|--------------------|--------------------|--------------------| | 最大描述符数 | 1024(可修改) | 无限制 | 无限制 | | 事件通知方式 | 轮询 | 轮询 | 回调 | | 时间复杂度 | O(n) | O(n) | O(1) | | 内存使用 | 固定大小位图 | 动态数组 | 红黑树+就绪链表 | | 适用场景 | 跨平台基础方案 | Linux中等规模连接 | Linux高性能服务 | --- ### 七、最佳实践建议 1. **连接数<1000**时可用select 2. **Windows平台**首选select(原生支持) 3. 必须配合**非阻塞IO**使用: ```c int flags = fcntl(fd, F_GETFL, 0); fcntl(fd, F_SETFL, flags | O_NONBLOCK); ``` 4. 及时清理无效描述符: ```c if(recv(fd, buf, sizeof(buf), 0) == 0) { FD_CLR(fd, &master_set); close(fd); } ``` --- ### 八、性能优化技巧 1. **分离监控集合**: - 使用独立的read/write监控集合 - 避免不必要的描述符检测 2. **动态调整超时**: ```c struct timeval base_tv = {0, 100000}; // 基础100ms if(idle_count > 10) { base_tv.tv_usec *= 2; // 空闲时降低检测频率 } ``` 3. **描述符分组管理**: ```c fd_set fast_set; // 高频交互连接 fd_set normal_set;// 普通连接 fd_set slow_set; // 长空闲连接 ``` select函数作为基础I/O多路复用方案,适合用于跨平台开发和小规模并发场景。对于现代高性能网络编程,建议在Linux环境下优先考虑epoll,在FreeBSD系统使用kqueue,Windows平台可考虑IOCP机制。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值