HTTP实现断点续传的方式

解析HTTP请求与响应完成PDF文件下载过程

最新推荐文章于 2025-09-02 13:46:23 发布

转载最新推荐文章于 2025-09-02 13:46:23 发布 · 2k 阅读

文章标签：

#服务器 #http

数据传输协议专栏收录该内容

9 篇文章

订阅专栏

本文详细解析了如何使用HTTP请求和响应完成一个PDF文件的下载过程，包括断点续传机制和使用curl命令实现文件合并。

以下是我请求一个pdf文件的请求报文与响应报文的头部信息。可以看到如何完成http请求一个pdf的完整的过程，整个pdf总共223,652 字节，由抓到的数据包可以分析出这个文件被服务器通过两个http响应完成。第一个请求请求了32KB，剩下的一个请求完成了剩下的190884Byte的文件。由于第一次GET请求并不知道请求的文件是多少，只有在第一个响应头部分析出这个文件是多大。并请求剩下的文件数据，而后浏览器对文件进行合并。

点击(此处)折叠或打开

GET /maindoc/Varnish_cache.pdf HTTP/1.1
Host: yaoweibin.cn
Connection: keep-alive
User-Agent: Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/30.0.1599.101 Safari/537.36
Accept: */*
Referer: http://yaoweibin.cn/maindoc/Varnish_cache.pdf
Accept-Encoding: gzip,deflate,sdch
Accept-Language: zh-CN,zh;q=0.8
Cookie: __cfduid=d616785c680fd944ee413a8817667c3a51389705653453
Range: bytes=0-32767

以下是HTTP的响应报文。由响应报头可知，断点续传是通过Content-Range字段来完成的。HTTP的response header中的206表示传送的是一个大文件，并没有传送完，一个218KB的文件通过两个HTTP的响应来完成。也就是说整个文件是分块传输的。

点击(此处)折叠或打开

HTTP/1.1 206 Partial Content
Server: cloudflare-nginx
Date: Wed, 29 Jan 2014 01:36:21 GMT
Content-Type: application/pdf
Content-Length: 32768
Connection: keep-alive
Last-Modified: Mon, 29 Apr 2013 07:27:12 GMT
CF-Cache-Status: HIT
Vary: Accept-Encoding
Expires: Wed, 29 Jan 2014 05:36:21 GMT
Cache-Control: public, max-age=14400
Content-Range: bytes 0-32767/223652
CF-RAY: f4230e866050293

我们也可以通过curl命令模拟http请求完成断点续传文件，然后将生成的两个文件利用cat 命令合并生成下载的文件。

点击(此处)折叠或打开

curl --header "Range: bytes=0-20000" yaoweibin.cn/maindoc/Varnish_cache.pdf -o part1
curl --header "Range: bytes=20001-223651" yaoweibin.cn/maindoc/Varnish_cache.pdf -o part2
cat part1 part2 >> a.pdf