最近接触了IOCP服务器的编写,对IOCP有了自己的一些认识,希望能对希望正在使用IOCP 的有些建议。我对IOCP了解不多,只是用到了,所以看了一下,还没怎么熟悉。
IOCP的一大优势是高并发率,同时连接1万个用户,CPU的使用率也不会很高,只是内存稍微增大一些了。而且对CPU的利用率很好,线程的量被固定了,所以线程可以更好的处理事情。
- CompletionPort = CreateIoCompletionPort(INVALID_HANDLE_VALUE, NULL, 0, 0);//创建完成端口
- for(i=0;i<systeminfo.dwNumberOfProcessors; i++){
- CreateThread(NULL, 0, WorkerThread, CompletionPort, 0, &dwThreadId);//根据CPU的数量创建线程个数,最好的是2*CPU+2
- }
- sListen = socket(AF_INET, SOCK_STREAM, IPPROTO_TCP);//监听端口
- sClient = accept(sListen, (struct sockaddr *)&client, &iaddrSize);
- //把新连入的Socket(也就是前面所谓的设备句柄),与目前的完成端口绑定在一起。
- CreateIoCompletionPort((HANDLE)sClient, CompletionPort, (DWORD)sClient, 0);
- lpPerIOData = (LPPER_IO_OPERATION_DATA)HeapAlloc(GetProcessHeap(),HEAP_ZERO_MEMORY,sizeof(PER_IO_OPERATION_DATA));
- lpPerIOData->Buffer.len = MAX_PACKBUFFER_SIZE;
- lpPerIOData->Buffer.buf = lpPerIOData->szMessage;
- lpPerIOData->OperationType = RECV_POSTED;
- WSARecv(sClient,&lpPerIOData->Buffer,1,&lpPerIOData->NumberOfBytesRecvd,&lpPerIOData->Flags, &lpPerIOData->overlap,NULL);
//接收数据
- static DWORD WINAPI server::WorkerThread(LPVOID CompletionPortID)
- {
- HANDLE CompletionPort=(HANDLE)CompletionPortID;
- DWORD dwBytesTransferred;
- SOCKET sClient;
- LPPER_IO_OPERATION_DATA lpPerIOData = NULL;
- while (TRUE)
- {
- GetQueuedCompletionStatus(CompletionPort,&dwBytesTransferred,(PULONG_PTR)&sClient,(LPOVERLAPPED *)&lpPerIOData,INFINITE);
- if (dwBytesTransferred == 0xFFFFFFFF)
- {
- return 0;
- }
- if (lpPerIOData->OperationType == RECV_POSTED)
- {
- if (dwBytesTransferred == 0)
- {
- // Connection was closed by client,将在线状态值设为0
- }
- else
- {
- //接收数据操作
- LPNET_PACK pack;
- pack=(LPNET_PACK)lpPerIOData->szMessage;
- //将数据重新装填
- memset(lpPerIOData, 0, sizeof(PER_IO_OPERATION_DATA));
- lpPerIOData->Buffer.len = MAX_PACKBUFFER_SIZE;
- lpPerIOData->Buffer.buf = lpPerIOData->szMessage;
- lpPerIOData->OperationType = RECV_POSTED;
- WSARecv(sClient,&lpPerIOData->Buffer,1,&lpPerIOData->NumberOfBytesRecvd,&lpPerIOData->Flags,&lpPerIOData->overlap,NULL);
- }
- }
- }
- return 0;
- }
1、静态函数问题,这一块是我个人的认识。因为线程的创建,线程函数是静态的,这样导致所有你处理的数据必须都是静态的,因为静态函数是在编译的时候就初始化了,所以无法处理一些类的非静态函数。这里可以综合考虑多种方式进行处理,动态链表,动态指针,动态存储区,这些需要new,动态申请空间的语句。还可以通过map,list这类可以动态增长的类型。
2、数据包的顺序问题。这个很重要,算是IOCP的一个缺点吧。因为多个线程从完成端口中取数据处理,难免有些线程处理过慢,过快,然后导致包的顺序处理错位,这对于服务器负责转发的时候是一个致命的问题。比如我的服务器负责客户端之间的转发数据,比如聊天数据,这时候,如果包的转发顺序错乱,则会使数据接收有问题。转发文件更称问题。我的解决方案是,服务器设置一个缓冲区,接收整个文件,接收完成后,将数据进行发出去。还有一种方法,不过会降低效率,控制数据发送的速度,比如100毫秒发送一个包,这样可以强制服务器顺序接收,不过服务器的性能如果很不好的话,这个方法还是不行。所以还是缓冲区好一些。
3、粘包的问题。所谓的粘包,我个人理解是,不同的系统在做相关的TCP发送操作的时候,会根据Nagle算法将数据包进行合并操作,所以那个时候自己做的相关操作包就会被封装在一起,这往往是我们不想看到的。这个解决方法很简单,将socket的类型进行设置一下就可以,将socket的类型设置为禁用nagle算法,即设置TCP_NODELAY这个。这个也可以解决2的问题,不需要100毫秒进行发送了。具体解释在http://blog.youkuaiyun.com/wangqing008/article/details/17403353
4、继续IOCP中的粘包和断包处理。对于第三点,其实我当时理解不多,或者说理解不够深入。其实禁用掉Nagle算法会有些改观,但是因为禁用掉Nagle算法后,程序运行比之前好很多,我以为已经解决了问题。但是还是自己考虑不周全。如果在公网上测试,特别是一些3G的网络测试,便会发现,粘包断包的问题很严重,具体原因在
http://blog.youkuaiyun.com/wangqing008/article/details/17403353后半部分。
我这里贴上解决办法,我这里的解决办法,是我自己想到的,但是我觉得并不是特别好,希望有更好的解决方案的朋友指点一下啊,因为搜了一些这种文章,最后没给自己的应用有多大帮助,最后还是按自己的想法做了。
我自己的想法是这样的,定义一个包头,包头 = 标示符+校验位+包长度,最关键的就这几个信息。在对数据进行粘包处理的时候比较简单,直接按包的结构取数据就好了。有一个比较棘手的是断包(因为TCP是流式协议),所以,最重要的是还如何处理断包,以发送“&&&&abcdefg”为一个包为例,其中“&&&&”为包头。
出现的几种情况这里简单说一下
(1)、断包分为两部分,一部分包括包头,另一部分包括数据部分。比如“&&&&abc”+“defg”,这种是最常见的,比较好解决,首先对包头进行检测,发现该断包的时候,将该断包存储到缓冲区内,作为备份。然后遇到下一个非完整数据(这里可以认为是包尾)与缓冲区内的数据进行拼包,然后对拼起来的包进行CRC校验,因为之前包头内有校验位,所以这里很好解决。这里就可以判断出一个包是否可以拼接起来。
(2)、断包分为两部分,一部分包括包头的一部分,另一部分包括“包头另一份+数据部分”,比如,“&&”+“&&abcdefg”,这种情况下,则直接将包丢弃了,因为无法对包头进行解析,将收到“&&”时直接将该断头包丢弃,然后接下来收到&&abcdefg的时候,与缓冲区内的数据进行拼包,发现拼接不了,这个时候,则是对接受到的缓冲区根据标示符查找下一个包数据,其实这里的意思则是把&&abcdefg丢弃掉。
(3)、断包分为三部分(或者四部分等等),分为三部分的这种情况对我来说,目前都是无法解决的。因为不论怎样,中间都会存在一个断头断尾包,这个是最令人讨厌的,无法完成拼包。按照2的逻辑需要丢弃。
其实我这里和TCP的处理方式差不多,不过TCP做的更好,因为TCP至少保证了不会出现丢包(这个是一个假设,当然他是可能丢包的,那个时候估计TCP的连接也会断开),但是TCP可以保证流的顺序到达,所以他的数据是顺序的。对于服务器来说,为什么要处理断包是因为,服务器是一个多线程的。对IOCP尤其如此,因为每个线程都去取数据,虽然数据到达顺序一定,但是线程处理速度不一定,导致TCP堆栈内的数据进入应用层的时间不一样。这个可以去了解IOCP的流程,我记得有一个讲的非常通俗易懂,有时间转载过来。
还有一种处理方式,我大致说一下解决方案,另外一个是对包的定义变化,额外定义了一个包尾,也就是数据包 = “包头”+“数据”+“包尾”,然后这种方式的话,有一点好处就是拼包的时候会更快,包头和包尾有相关联的信息,比如sequence是一致的,则可以直接去匹配,而不用我上面的说的方式去计算校验值。但是这种方法最终也是要计算校验值的。我个人觉得第一张方案比较好,因为有了包尾的限制,其实对数据的处理往往复杂多变,包尾的标识符,可能也会因为数据中存在相同的数据存在而被误认为是包尾。
这两种方案目前自己都实现了,因为第二种是导师提出的,但是我个人还是倾向第一种,最终还是用了第二种,原因惟“导师”2字。
下面贴出来大致流程,我把代码简化了,可能用不了了。存储断头包的时候,我用的map和list来实现的。对于第二种有包尾的方案,我用的是双层map来实现的。
- //接收数据操作
- LPNET_PACK pack;
- pack=(LPNET_PACK)lpPerIOData->szMessage;
- //起始读取位置
- int nlen=0;
- //检查是否是包尾,进行拼包检查
- if(pack->m_nSeque == PACK_SEQUE){
- if(!pack->VerifyCRC()){
- //是一个残包(只有一个有包头的前半部分半包)
- // 或者断包(一个后半部分的半包+若干其他包)
- if(dwBytesTransferred>=pack->m_nSize){
- //判断是否是一个断包
- goto pinbao;
- }
- else{
- //收到的数据就是一个残包,直接进行断包处理,存储断包
- }
- }
- //运行到这里是一个正常包
- }
- else{
- ao:
- //进行拼包处理
- //取出来list
- list<OFFPACK> slist;
- map<SOCKET,list<OFFPACK>>::iterator listiter;
- listiter=socketlist.find(sClient);
- if(listiter!=socketlist.end()){
- slist = listiter->second;
- }else{
- //正常情况下不会执行,需要进行错误处理
- }
- list<OFFPACK>::iterator iter;
- iter=slist.begin();
- //申请一个缓冲区空间
- char * buffer =NULL;
- for(int newi=0;newi<5;newi++){
- try{
- buffer = new char[MAX_PACKBUFFER_SIZE];
- if(buffer != NULL){
- break;
- }
- }
- catch(...){
- buffer = NULL;
- printf("申请内存失败\n");
- }
- Sleep(20*(newi+1));
- }
- while(buffer!=NULL&&iter!=slist.end()){
- //取出offpack的包
- OFFPACK offpack;
- offpack = *(iter);
- //添加
- pack = (LPNET_PACK)offpack.buff;
- int bufferlength = pack->m_nSize;
- //将数据取出
- int packlength = (int)pack->m_nSize-offpack.length;
- if(packlength-1<0 //剩下的部分大于要拼的,也即是拼起来也不够
- ||packlength>MAX_PACKBUFFER_SIZE){//拼起来长度过长 都略过
- iter++;
- continue;
- }
- //对缓冲区清零
- memset(buffer,0,MAX_PACKBUFFER_SIZE);
- //拼接
- memcpy(buffer,pack,packlength);
- memcpy(buffer+packlength,lpPerIOData->szMessage,offpack.length);
- pack=(LPNET_PACK)buffer;
- //计算CRC校验
- if(pack->VerifyCRC()){
- //拼包成功
- DealRecvPack();
- //清除掉内存
- delete offpack.buff;
- //将读取指针移位
- nlen=offpack.length;
- //将断头包去掉
- slist.erase(iter);
- //退出循环
- break;
- }else{
- //拼包不成功,继续尝试下一个包
- cout<<"出现问题"<<endl;
- }
- iter++;
- }
- //清空缓冲区
- if(buffer != NULL){
- delete buffer;
- }
- //找下一个包头数据,找标识符,packseque校验
- while(nlen<dwBytesTransferred){
- pack = (LPNET_PACK)(lpPerIOData->szMessage+nlen);
- if(pack->m_nSeque == PACK_SEQUE){//&&
- if(pack->VerifyCRC()){
- //下一个正常报,跳出while循环
- break;
- }
- else if(pack->m_nSize>(int)dwBytesTransferred-nlen){
- //剩余一个只有包头的包
- break;
- }
- else{
- //出现断头断尾包,忽略
- cout<<"出现忽略的包"<<endl;
- }
- }
- nlen++;
- cout<<"忽略包"<<endl;
- }
- }
- while(nlen<(int)dwBytesTransferred){
- //将数据取出来
- pack=(LPNET_PACK)(lpPerIOData->szMessage+nlen);
- //校验CRC,包错误,跳过这个包
- if(!pack->VerifyCRC()){
- if((int)dwBytesTransferred-nlen>=8){
- nlen += pack->m_nSize;
- //将地址指针存入map(map 存放list)
- char * buffer = NULL;
- for(int newi=0;newi<5;newi++){
- try{
- buffer = new char[pack->m_nSize];
- if(buffer != NULL){
- break;
- }
- }
- catch(...){
- buffer = NULL;
- printf("申请内存失败\n");
- }
- Sleep(20*(newi+1));
- }
- if(buffer == NULL){
- break;
- }
- memcpy(buffer,pack,pack->m_nSize-(nlen-(int)dwBytesTransferred));
- //加入到断包
- //取出来list
- list<OFFPACK> slist;
- //添加入断头包list,呵呵
- OFFPACK offpack;
- offpack.buff=buffer;
- offpack.length=nlen-(int)dwBytesTransferred;
- slist.push_back(offpack);
- map<SOCKET,list<OFFPACK>>::iterator listiter;
- listiter=socketlist.find(sClient);
- if(listiter!=socketlist.end()){
- listiter->second = slist;
- //避免下一个包不会出现断头断尾包
- Sleep(10);
- }else{
- //正常情况下不会执行
- }
- break;
- }
- else{//(nlen-(int)dwBytesTransferred>0)
- //无头包
- break;
- }
- }
- else{
- DealRecvPack(pack,pDbconn,sClient);
- nlen += pack->m_nSize;
- }
- }
这段代码需要放在上一段的31-32行之间。需要的时候进行补充。感觉还是需要根据自己的项目进行自我定制。