HTTP学习
一、介绍
HTTP,全称为 HyperText Transfer Protocol,即为超文本传输协议。是互联网应用最为广泛的一种网络协议,所有的 www 文件都必须遵守这个标准。它有以下特点:
-
无连接、无状态
无状态是指客户机(Web浏览器)和服务器之间不需要建立持久的连接,这意味着当一个客户端向服务器端发出请求,然后服务器返回响应(response),连接就被关闭了,在服务器端不保留连接的有关信息.HTTP 遵循请求(Request)/应答(Response)模型。
无状态是指协议对于事务处理没有记忆能力。缺少状态意味着如果后续处理需要前面的信息,则它须重传,这样可能导致每次连接传送的数据量增大。另一方面,在服务器不需要先前信息时它的应答就较快。
-
一般构建于TCP/IP协议之上,默认端口是80
二、核心:Request和Response
-
request:请求行(request line)、请求头部(header)、空行和请求数据四个部分组成。
- 请求行:用来说明请求类型,要访问的资源以及所使用的HTTP版本
- 请求头部:紧接着请求行(即第一行)之后的部分,用来说明服务器要使用的附加信息
- 空行:请求头部后面的空行是必须的
- 请求数据:也叫主体,可以添加任意的其他数据
-
response:也由四个部分组成,分别是:响应头行、消息报头、空行和响应正文
- 响应头行:状态行,由HTTP协议版本号, 状态码, 状态消息 三部分组成
- 消息报:用来说明客户端要使用的一些附加信息
- 空行:消息报头后面的空行是必须的
- 相应正文:服务器返回给客户端的文本信息
三.状态码
-
1xx:指示信息–表示请求已接收,继续处理
-
2xx:成功–表示请求已被成功接收、理解、接受
-
3xx:重定向–要完成请求必须进行更进一步的操作
-
4xx:客户端错误–请求有语法错误或请求无法实现
-
5xx:服务器端错误–服务器未能实现合法的请求
四.请求方法列表
根据HTTP标准,HTTP请求可以使用多种请求方法。
-
HTTP1.0定义了三种请求方法: GET, POST 和 HEAD方法。
-
HTTP1.1新增了五种请求方法:OPTIONS, PUT, DELETE, TRACE 和 CONNECT 方法。
- GET : 请求指定的页面信息,并返回实体主体。
- HEAD: 类似于get请求,只不过返回的响应中没有具体的内容,用于获取报头
- POST:向指定资源提交数据进行处理请求(例如提交表单或者上传文件)。数据被包含在请求体中。POST请求可能会导致新的资源的建立和/或已有资源的修改。
- PUT:从客户端向服务器传送的数据取代指定的文档的内容。
- DELETE:请求服务器删除指定的页面。
- CONNECT:HTTP/1.1协议中预留给能够将连接改为管道方式的代理服务器。
- OPTIONS:允许客户端查看服务器的性能。
- TRACE:回显服务器收到的请求,主要用于测试或诊断。
五、工作流程
HTTP协议定义Web客户端如何从Web服务器请求Web页面,以及服务器如何把Web页面传送给客户端。HTTP协议采用了请求/响应模型。客户端向服务器发送一个请求报文,请求报文包含请求的方法、URL、协议版本、请求头部和请求数据。服务器以一个状态行作为响应,响应的内容包括协议的版本、成功或者错误代码、服务器信息、响应头部和响应数据。以下是 HTTP 请求/响应的步骤:
- 客户端连接到服务器
- 一个HTTP客户端,通常是浏览器,与Web服务器的HTTP端口(默认为80)建立一个TCP套接字连接。例如,www.baidu.com;
- 发生HTTP请求
- 通过TCP套接字,客户端向Web服务器发送一个文本的请求报文,一个请求报文由请求行、请求头部、空行和请求数据4部分组成。
- 服务器接收请求并返回HTTP响应
- 客户端浏览器解析HTML内容
- 客户端浏览器首先解析状态行,查看表明请求是否成功的状态代码。然后解析每一个响应头,响应头告知以下为若干字节的HTML文档和文档的字符集。客户端浏览器读取响应数据HTML,根据HTML的语法对其进行格式化,并在浏览器窗口中显示。
例如,有个问题在面试里经常问到,在浏览器地址栏键入URL,按下回车之后会发生什么?
- 浏览器向DNS服务器发起请求解析该URL对应的域名,得到IP地址
- 根据IP地址于对应服务器建立连接(三次握手)
- 浏览器发出读取文件的请求,将请求报文作为TCP三次握手的第三个报文数据发送给服务器
- 服务器接收请求并作出响应,把对应的html文本发送给浏览器
- 释放TCP连接
- 浏览器解析html文本,进行展示