经过本人对WebSocket协议的研究和WebSocket服务器的编写,对WebSocket有了深入的了解,在此写个总结供以后研究参考。
1.概要
WebSocket是最新提出用于实现服务器与浏览器双向通信的一种解决方案,用于取代一些传统的数据推送方案(如iframe长连接,ajax轮询等)。该方案由于一直在草案阶段,最新的版本为version 13.该版本出现在RFC6455中。而在safari(包括桌面和移动版本)上则是使用的websocket的 draft-ietf-hybi版。照这个趋势看来,WebSocket早晚会向RFC6455的方向定型。
在本文中,称RFC6455版的chrome版,safari使用的版本为safari版。
这两个文件我已经下载下来作为本文附件,可直接参考。chrome版 safari版
2.握手协议
HTTP服务器识别WebSocket协议的方式首先是判断HTTP头中的Connection和Upgrade头,如果Connection是Upgrade,且Upgrade头是WebSocket,则可以确定为WebSocket请求,这时候要进行WebSocket的握手处理,两个版本的握手方式不同,最新的Chrome版本通过Sec-WebSocket-Key的设置进行一些计算返回Sec-WebSocket-Accept响应头,而safari版本通过Sec-WebSocket-Key1,Sec-WebSocket-Key2及请求主体三个共同计算响应主体的。下面进行分别讨论。
chrome版
Sec-WebSocket-Key是客户端随机生成并进行base64的字符串,它的原始内容是什么服务器不需要关心,服务器需要将这个字符串,与”258EAFA5-E914-47DA-95CA-C5AB0DC85B11″这个字符串进行拼接,然后对这个拼接好的字符串进行sha-1运算,再把sha-1散列得到的20字节进行base64编码即为响应头Sec-WebSocket-Accept的值。
safari版
这个版本让人觉得有点意思,有种小学玩数数棍的感觉。下面给个示例请求:
Sec-WebSocket-Key1: 18x 6]8vM;54 *(5: { U1]8 z [ 8
Sec-WebSocket-Key2: 1_ tx7X d < nw 334J702) 7]o}` 0
Tm[K T2u
首先,我们把Sec-WebSocket-Key1和Sec-WebSocket-Key2中的所有数字从左到右提出来组成一个整数,那么上面的示例可以组成1868545188 和 1733470270两个数。
接下来我们去数两个串各自的空格数,数出来分别为12和10
然后将上面的数除以下面的数,可得到155712099 和 173347027
这两个数是32位的整数,以Big-Endian的方式(低地址存放最高字节)各保存为4个字节,再与请求体中的8个字节拼接,可以得到一个16字节的串.再对这个串进行md5,md5结果的16字节即作为响应体返回给客户端.
这个示例将返回fQJ,fN/4F4!~K~MH,示例是巧合,实际上返回的内容可以是乱码的.但key中不会出现乱码.
下面是我已经写好的计算响应值的C函数:
/**
* chrome版websocket响应值计算
*/
void websocket_accept_key(const char* key,int key_len,char* out){
char tmp[128];
unsigned char sha[20];
if(key_len==0) key_len=strlen(key);
strcpy(tmp,key);
strcpy(tmp+key_len,"258EAFA5-E914-47DA-95CA-C5AB0DC85B11");
sha1(tmp,key_len+36,sha);
base64_encode(sha,20,out);
}
/**
* safari版websocket响应值计算
*/
void websocket_accept_key_old(const char* key1,int key1Len,const char* key2,int key2Len,char* body,char* out){
char tmp[16];
unsigned long long kv1=0;
unsigned long long kv2=0;
int c1=0;
int c2=0;
int i;
if(key1Len<=0) key1Len=strlen(key1);
if(key2Len<=0) key2Len=strlen(key2);
for(i=0;i
if(key1[i]>='0' && key1[i]<='9') kv1=kv1*10+(key1[i]-'0');
else if(key1[i]==' ') c1++;
}
for(i=0;i
if(key2[i]>='0' && key2[i]<='9') kv2=kv2*10+(key2[i]-'0');
else if(key2[i]==' ') c2++;
}
kv1/=c1;
kv2/=c2;
for(i=3;i>=0;i--){
tmp[i]=kv1&0xff;
tmp[i+4]=kv2&0xff;
kv1=kv1>>8;
kv2=kv2>>8;
}
for(i=0;i<8;i++){
tmp[i+8]=body[i];
}
md5(tmp,16,out);
out[16]=0;
}
为什么要做这么复杂的握手?这是为了让客户端知道这个服务器是否真的支持websocket,因为这个协议本来很像HTTP协议,如果直接向HTTP服务器发起这样的请求,服务器同样会响应并返回Bad request.
3.结论
经过分析可以知道两种方式的握手步骤,对比下来version13版的websocket握手更加简单.目前version13已经正为websocket正式版本,后期的改动应该不会有太多大的变动.