HTTP实现断点续传的方式

本文详细解析了如何使用HTTP请求和响应完成一个PDF文件的下载过程,包括断点续传机制和使用curl命令实现文件合并。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

以下是我请求一个pdf文件的请求报文与响应报文的头部信息。可以看到如何完成http请求一个pdf的完整的过程,整个pdf总共223,652 字节,由抓到的数据包可以分析出这个文件被服务器通过两个http响应完成。第一个请求请求了32KB,剩下的一个请求完成了剩下的190884Byte的文件。由于第一次GET请求并不知道请求的文件是多少,只有在第一个响应头部分析出这个文件是多大。并请求剩下的文件数据,而后浏览器对文件进行合并。

点击(此处)折叠或打开

  1. GET /maindoc/Varnish_cache.pdf HTTP/1.1
  2. Host: yaoweibin.cn
  3. Connection: keep-alive
  4. User-Agent: Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/30.0.1599.101 Safari/537.36
  5. Accept: */*
  6. Referer: http://yaoweibin.cn/maindoc/Varnish_cache.pdf
  7. Accept-Encoding: gzip,deflate,sdch
  8. Accept-Language: zh-CN,zh;q=0.8
  9. Cookie: __cfduid=d616785c680fd944ee413a8817667c3a51389705653453
  10. Range: bytes=0-32767

以下是HTTP的响应报文。由响应报头可知,断点续传是通过Content-Range字段来完成的。HTTP的response header中的206表示传送的是一个大文件,并没有传送完,一个218KB的文件通过两个HTTP的响应来完成。也就是说整个文件是分块传输的。

点击(此处)折叠或打开

  1. HTTP/1.1 206 Partial Content
  2. Server: cloudflare-nginx
  3. Date: Wed, 29 Jan 2014 01:36:21 GMT
  4. Content-Type: application/pdf
  5. Content-Length: 32768
  6. Connection: keep-alive
  7. Last-Modified: Mon, 29 Apr 2013 07:27:12 GMT
  8. CF-Cache-Status: HIT
  9. Vary: Accept-Encoding
  10. Expires: Wed, 29 Jan 2014 05:36:21 GMT
  11. Cache-Control: public, max-age=14400
  12. Content-Range: bytes 0-32767/223652
  13. CF-RAY: f4230e866050293
我们也可以通过curl命令模拟http请求完成断点续传文件,然后将生成的两个文件利用cat 命令合并生成下载的文件。

点击(此处)折叠或打开

  1. curl --header "Range: bytes=0-20000" yaoweibin.cn/maindoc/Varnish_cache.pdf -o part1

  2. curl --header "Range: bytes=20001-223651" yaoweibin.cn/maindoc/Varnish_cache.pdf -o part2

  3. cat part1 part2 >> a.pdf
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值