FastDFS 5.04之IO读事件空转导致CPU空转

最新推荐文章于 2022-12-28 12:00:42 发布

转载最新推荐文章于 2022-12-28 12:00:42 发布 · 1.4k 阅读

fastdfs分布式文件系统专栏收录该内容

24 篇文章

订阅专栏

在使用FastDFS过程中遇到CPU使用率异常波动的问题，主要原因是IO读事件空转导致的任务处理延迟。文章详细分析了问题产生的原因，并提出了解决方案。同时，还讨论了磁盘处理队列任务丢失的问题及其潜在风险。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在与同事测试FastDFS过程中发现CPU有异常波动的情况，八核心CPU在系统使用同时达到%60以上，不免诧异，遂对代码进行排查，发现storage有如下两个问题：

1）CPU短暂地飙升

2）特定的情况下，可以导致CPU永久飙升，直到停止程序

这两个问题都是由于IO读事件空转导致。

IO读事件空转也就是epoll触发了一个读事件，调用相应地处理函数，而该处理函数什么事情也不干就返回了，由于事件触发条件还在，因此调用epoll_wait后再次触发，如此反复，CPU消耗在了系统调用上。

注：作者已经修改了第二个问题，第一个问题作者暂时还没有修改。关于第二个问题只要更新作者提供的最新libcommon代码即可。

一、CPU短暂地飙升

为了方便理解，此处载录少量关键代码。

1、读取网络数据处理函数 client_sock_read

FastDFS中每个连接对应一个任务，每个任务自带缓冲区，默认为256KB，当一个客户端Upload的文件的大小若为1MB，那么就需要分4次读到缓冲区，每次缓冲区读满需要将该任务提交给磁盘线程（DIO），由磁盘线程将缓冲区内容写入到文件之后，再次读取后面的内容，如此反复直到整个请求包读取完成。

此处定义package为一个缓冲区大小，256KB，request为一次请求大小，1MB。

[cpp]view plaincopy 
    
 void client_sock_read(int sock,short event, void* arg){  
         ///从参数中提取任务  
 <span style="white-space:pre">    </span>struct fast_task_info *pTask = (structfast_task_info *)arg;  
 <span style="white-space:pre">    </span>StorageClientInfo*pClientInfo = (StorageClientInfo*)pTask->arg;  
   
 <span style="color:#cc0000;">        ///判断任务的状态，若状态非RECV则直接返回，不做任何处理，导致空转  
 </span><span style="white-space:pre">   </span>if(pClientInfo->stage!= FDFS_STORAGE_STAGE_NIO_RECV){return;}  
   
         ///读取网络数据报  
         while(1){  
              bytes = recv(…)  
              if(bytes < =0){  
                ……  
                break;  
              }  
   
              if(package recv done)  ///一个缓冲区读取完成  
  <span style="white-space:pre">       </span>{   
                  if(reqeust recv done){   ///一次请求读取完成，改变状态为SEND  
                    pClientInfo->stage = FDFS_STORAGE_STAGE_NIO_SEND;  
                  }  
               
                  ///push into dio thread queue  
                 storage_dio_queue_push(pTask);  
                 return;  
 <span style="white-space:pre">        </span>}  
      }  
 }  

接着我们来看下任务添加到磁盘IO线程的代码，如下，注意在其中改变了任务状态。

[cpp]view plaincopy 
     
 intstorage_dio_queue_push(structfast_task_info *pTask){  
 <span style="color:#cc0000;">     ///设置任务状态为IO处理中  
      pClientInfo->stage|= FDFS_STORAGE_STAGE_DIO_THREAD;  
 </span>  
      ///将任务添加到磁盘IO处理线程同步队列  
      result=task_queue_push(&(pContext->queue), pTask);  
   
      ///使用条件变量通知磁盘IO线程有任务到达  
      result=pthread_cond_signal(&(pContext->cond));  
 }  

让我们来分析下，epoll有两种工作方式，分别是水平触发与边缘触发。FastDFS中使用epoll的水平触发工作方式。

还是以客户端Upload一个1MB文件，缓冲区为256KB为例：

1）storage服务器通过client_sock_read函数不断从网络中读取数据，直到一个缓冲区读满了，这时候需要将任务交给磁盘线程处理。

2）调用 storage_dio_queue_push函数将任务加入到磁盘处理队列，在其中会设置任务状态为 |= FDFS_STORAGE_STAGE_DIO_THREAD

3）client_sock_read函数返回（注意，代码中并没有将该FD从epoll事件监听列表中清除）

4）假如此时该socket之中还有数据，或者客户端关闭该socket，该socket都将会继续触发读事件，问题来了，读事件的处理函数中

[cpp]view plaincopy 
      
 只有任务状态为RECV才会处理，因此直接返回。再次调用epoll_wait时，马上又会触发该事件，如此反复，CPU都消耗在了epoll_wait的系统调用上。  

同样地，当读取完成1MB的数据之后，client_sock_read函数先将任务状态设置成SEND，然后将任务提交给磁盘IO处理线程，在磁盘IO线程处理完成该任务之前，都存在读事件空转的可能。

改进方法：将任务提交给磁盘IO处理线程成功后，应该将该socket从epoll监听列表中清除，待磁盘处理完成后再添加到epoll监听列表之中。

2、网络写入函数，client_sock_write函数，该函数实现将数据发送给客户端，比如客户端要下载一个文件时。

根据之前的介绍，每个任务都自带缓冲区，默认256KB，若下载一个1MB的文件，那么每次只能读取256KB的内容到缓冲区，然后发送缓冲区内容给客户端，如此需要重复4次才能发送完成。

注意：在触发该函数之前任务的状态为 FDFS_STORAGE_STAGE_NIO_SEND；

[cpp]view plaincopy 
      
 voidclient_sock_write(intsock,shortevent,void*arg){  
         ///从参数中提取任务  
 <span style="white-space:pre">    </span>struct fast_task_info *pTask = (structfast_task_info *)arg;  
        StorageClientInfo*pClientInfo = (StorageClientInfo*)pTask->arg;  
   
         ///读取网络数据报  
         while(1){  
              bytes = send(…)  
              if(bytes <= 0){  
                ……..  
                break;  
              }  
   
              if(package send done)  ///一个缓冲区写入完成  
      <span style="white-space:pre">   </span>     {  
                  set_recv_event(pTask);   ///将当前监听写事件修改成监听读事件  
                  if(reqeust send done){   ///一次请求写入完成，改变状态为RECV  
                    pClientInfo->stage = FDFS_STORAGE_STAGE_NIO_RECV;  
                  }  
               
                  ///push into dio thread queue  
                 storage_dio_queue_push(pTask);  
                 return;  
      <span style="white-space:pre">   </span>    }  
      }  
 }  

看出问题所在了么，write函数将一个缓冲区写入到socket之后，设置了读事件监听，然后将任务提交给磁盘IO处理线程。由于此时该任务的状态为SEND，而读事件的处理函数client_sock_read只有在任务状态为RECV才处理，这里又存在读事件空转的可能性了。那么这种可能性是什么呢？也就是什么时候会变成可读，那就是当客户端关闭时，该socket就变成可读。

上述说明的两点还不算太坏，因为空转是短暂的，只要磁盘线程处理完成任务，空转就会停止，但是我下面要说的一点是，空转永远不会停止的。由于FastDFS代码中的BUG，导致有些任务添加到磁盘处理队列后丢失，该任务永远不会被磁盘线程处理到，那么就会停留在空转上。只要这个条件触发，即使把所有客户端都关闭也不能停止CPU的空转。

二、关于磁盘处理队列任务丢失

1、在FastDFS之中，为每个客户端socket连接分配一个Task,每次分配一块大内存，然后在其中分割出多个Task。如下图：

全局的g_mpool是内存块的链表，由于当前只有一个内存块，因此head、tail都指向该块。

同时这些任务被分配使用后，每个client上有不同的请求，假定某一个时刻的磁盘处理线程任务队列如下图，T1->T4->T2->T3;