Accept-Encoding、Content-Encoding、Transfer-Encoding

一、为什么要编码(压缩)

  • 编码的目的就是为了压缩报文实体内容的大小,而通过压缩服务器响应报文传输的内容实体,在一定程度上就可以加快响应的速度。
  • encode:If you encode a message or some information, you put it into a code or express it in a different form or system of language.
    Accept-Encoding:设置接受的编码格式(对内容[body部分]压缩方式)

二、Accept-encoding与Content-encoding压缩过程

  1. 浏览器发送Http request 给Web服务器, request 中有Accept-Encoding: gzip, deflate。 (告诉服务器, 浏览器支持gzip压缩)

  2. Web服务器接到request后, 生成原始的Response, 其中有原始的Content-Type和Content-Length。

  3. Web服务器通过Gzip,来对Response进行编码, 编码后header中有Content-Type和Content-Length(压缩后的大小), 并且增加了Content-Encoding:gzip. 然后把Response发送给浏览器。

  4. 浏览器接到Response后,根据Content-Encoding:gzip来对Response 进行解码。 获取到原始response后, 然后显示出网页。

(因为客户端Accept-Encoding有可能提供了多种解压方式,所以服务端返回时,要指定是用哪种压缩方式进行压缩的)
在这里插入图片描述

三、二中为什么要加content-length

  • 在http1.0时非持久连接,是用连接是否关闭来界定请求或响应实体的边界;对于http1.1持久连接(浏览器可以重用已经打开的空闲持久连接,来避免三次握手,从而避免遇上TCP慢启动的拥塞适应阶段),显然不奏效,因为连接并没有关闭,造成浏览器并不知道已经发送完毕(尽管服务端已经发送完所有数据),从而导致响应内容不会显示在浏览器界面上。
  • 要解决这个问题可以在响应头上加content-length,浏览器用此字段判断响应实体结束。
  • 但是content-length有时并不容易获取,需要开足够大的buffer,等内容全部生成再计算,从而造成内存开销大而且用户等待时间长(这不利于用户体验),为解决此问题,有了Transfer-Encoding。

四、传输编码Transfer-Encoding解决的问题

  • Transfer-Encoding会改变报文的格式和传输方式,使用它不会减少内容传输的大小,甚至会使传输变大,但是解决了content-length所带来的问题。

五、Transfer-Encoding-Chunked格式

  • 将报文中实体用分块方式来传输。每个分块包含16进制的长度值及数据,最后一个分块长度值必须为0,代表传输结束。
  • Transfer-Encoding: chunked:数据以一系列分块的形式进行发送。 Content-Length 首部在这种情况下不被发送。

六、Content-Encoding和Transfer-Encoding结合使用

即先对内容压缩,再对其分块传输。

在这里插入图片描述

参考:https://blog.youkuaiyun.com/zhangzeguang88/article/details/51554097
https://www.cnblogs.com/plokmju/p/http_code.html

### HTTP 响应头字段意义解析 #### 1. **Date** `Date` 字段表示服务器生成响应的时间戳。它通常用于缓存机制以及帮助客户端判断资源的新鲜度。时间格式遵循 RFC 1123 标准,例如 `Sun, 06 Nov 1994 08:49:37 GMT`[^1]。 #### 2. **Vary** `Vary` 字段指示缓存如何决定是否使用缓存中的副本。它的值通常是请求头字段名,比如 `User-Agent` 或 `Accept-Encoding`。这意味着对于相同的 URL,不同的请求头可能会返回不同版本的响应内容[^2]。 #### 3. **Transfer-Encoding** `Transfer-Encoding` 定义了消息体的传输编码方式。常见的值有 `chunked`,表示消息体被分割成多个块发送,适用于动态生成的内容或未知大小的消息体。这种编码方式允许逐块读取数据而无需提前知道整个消息体的长度[^3]。 #### 4. **Connection** `Connection` 控制当前连接的状态行为。常见值包括 `keep-alive`(保持连接)、`close`(关闭连接)。当设置为 `keep-alive` 时,浏览器可以复用同一个 TCP 连接发起多次请求;而 `close` 则会在完成本次请求后立即断开连接[^1]。 #### 5. **Content-Type** `Content-Type` 描述了实体主体内的对象类型及其字符集信息。例如,在 JSON 数据交互场景下,服务端会通过如下代码指定 MIME 类型和编码: ```java response.setContentType("application/json;charset=utf-8"); ``` 这表明响应内容是一个 UTF-8 编码的 JSON 文档[^4]。 #### 6. **Content-Encoding** `Content-Encoding` 指明了内容经过何种压缩算法处理过。典型的应用如 Gzip (`gzip`)、Deflate (`deflate`) 等。客户端可以通过发出支持的压缩方法列表告知服务器其能力范围,从而实现更高效的网络传输效率提升[^2]。 #### 7. **Server** `Server` 提供关于 Web 服务器软件的信息,可能还包括操作系统名称或其他细节。虽然此头部并非强制性的,但它有助于诊断问题或者了解目标站点的技术栈情况[^3]。 ```python import http.client conn = http.client.HTTPSConnection("example.com") headers = {'Accept': 'text/html'} conn.request("GET", "/", headers=headers) res = conn.getresponse() print(res.status, res.reason) for header in res.headers.items(): print(header) ```
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值