以下是我请求一个pdf文件的请求报文与响应报文的头部信息。可以看到如何完成http请求一个pdf的完整的过程,整个pdf总共223,652 字节,由抓到的数据包可以分析出这个文件被服务器通过两个http响应完成。第一个请求请求了32KB,剩下的一个请求完成了剩下的190884Byte的文件。由于第一次GET请求并不知道请求的文件是多少,只有在第一个响应头部分析出这个文件是多大。并请求剩下的文件数据,而后浏览器对文件进行合并。
以下是HTTP的响应报文。由响应报头可知,断点续传是通过Content-Range字段来完成的。HTTP的response header中的206表示传送的是一个大文件,并没有传送完,一个218KB的文件通过两个HTTP的响应来完成。也就是说整个文件是分块传输的。
我们也可以通过curl命令模拟http请求完成断点续传文件,然后将生成的两个文件利用cat 命令合并生成下载的文件。
点击(此处)折叠或打开
- GET /maindoc/Varnish_cache.pdf HTTP/1.1
- Host: yaoweibin.cn
- Connection: keep-alive
- User-Agent: Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/30.0.1599.101 Safari/537.36
- Accept: */*
- Referer: http://yaoweibin.cn/maindoc/Varnish_cache.pdf
- Accept-Encoding: gzip,deflate,sdch
- Accept-Language: zh-CN,zh;q=0.8
- Cookie: __cfduid=d616785c680fd944ee413a8817667c3a51389705653453
- Range: bytes=0-32767
-
点击(此处)折叠或打开
- HTTP/1.1 206 Partial Content
- Server: cloudflare-nginx
- Date: Wed, 29 Jan 2014 01:36:21 GMT
- Content-Type: application/pdf
- Content-Length: 32768
- Connection: keep-alive
- Last-Modified: Mon, 29 Apr 2013 07:27:12 GMT
- CF-Cache-Status: HIT
- Vary: Accept-Encoding
- Expires: Wed, 29 Jan 2014 05:36:21 GMT
- Cache-Control: public, max-age=14400
- Content-Range: bytes 0-32767/223652
- CF-RAY: f4230e866050293
点击(此处)折叠或打开
-
curl --header "Range:
bytes=0-20000" yaoweibin.cn/maindoc/Varnish_cache.pdf -o part1
-
-
curl --header "Range: bytes=20001-223651" yaoweibin.cn/maindoc/Varnish_cache.pdf -o
part2
-
- cat part1 part2 >> a.pdf