http 协议是干什么的
为了实现数据的通信,所制定的一套数据通讯协议。
一张图看 TPC/IP 协议
IP(Internet Protocol) 网际协议,与我们常说的“IP 地址”不同。
TCP 提供可靠的字节流服务,把数据分割,更容易传输。
三次握手(不含https)
通俗点说
客户端:我想在你那拿点资料,行吗?
服务器:可以,给你。(或者:不行,你没权限,我不能给你。)
客户端:好的,知道了。
- 发送端发送一个带 SYN(synchronize)同步标志的数据包给对方;
- 接收端收到后,回传一个带有 SYN/ACK(Acknowledgement) 确认标志的数据包确认信息;
- 发送端再回传一个带 ACK 标志的数据包,表示握手结束。
DNS 是什么
如果你直接拿 IP 地址访问,不需要 DNS ,它是用来把域名转换为 IP 地址的。(你可以想下为什么修改host 可以翻墙?)
URI 、URL 和 URN
URI:Uniform Resource Identifier,统一资源标识符;
URL:Uniform Resource Locator,统一资源定位符,它是一种URI,它可以标识资源的路径;
URN:Uniform Resource Name,统一资源名称,它是一种URI,它代表资源的名字。
请求方式
常用的主要有:GET POST
还有一些不常用的:PUT DELETE ……
状态码
- 100 类信息性状态码,请求正在处理
- 200 类成功状态码,请求正常处理完成
- 300 类重定向(多为缓存、跳转登录)状态码,需要进行附加操作
- 400 类客户端错误状态码,服务器无法处理请求
500 类服务器错误状态码,服务器内部出错
-
204 no content 无内容
206 partial content 部分内容 -
301 long redirect 永久重定向
302 temp redirect 临时重定向
303 post 方法将会改变为 get 方法请求(标准是禁止的,但301、302 大家也这样处理)
304 not modified
307 temporary redirect 与 302 相同,但不会把 post 改为 get -
400 请求报文语法存在错误
401 未认证
403 访问被服务器拒绝
404 无法找到资源 -
500 服务器内部错误
503 服务器不可用
报文
在控制台看到的请求的首部(Header)信息
- 通用首部
- 请求首部
- 响应首部
- 实体首部
数据传输
- 发送端压缩、分割
- 接收端复原
压缩涉及到:
- GZIP(GNU zip)
- compress(UNIX 系统的标准压缩)
- deflate(zlib)
- identity(不进行编码)
在浏览器地址栏输入一个URL后回车,接下来发生了什么?改良自 stackoverflow
- 检查缓存(有缓存状态为 300 类状态码,跳到9)
- 问系统要IP
- 系统查询域名系统(如 host 有直接返给浏览器),给浏览器IP
- 浏览器建立 TCP 链接(https 会索要证书,下载并验证证书)
- 浏览器通过 TCP 发送 SYN(synchronous) 消息
- 浏览器接收到服务器返回的 SYN + ACK(Acknowledgement) 消息后关闭或继续保持连接
- 浏览器检查返回数据状态(200, 404, 500,……)
- 如果可缓存,相应结果将存进缓存
- 浏览器解码数据请求(例如:gzip)
- 浏览器检查数据格式,决定做出相应的行为
- 渲染/下载