HTTP协议---工作原理&报文详情&完整请求过程

1、工作原理

1.1、OSI 七层模型

OSI(Open System Interconnection,开放系统互连)七层网络模型称为开放式系统互联参考模型 ,是一个逻辑上的定义,一个规范,它把网络从逻辑上分为了7层。每一层都有相关、相对应的物理设备,比如路由器,交换机。OSI 七层模型是一种框架性的设计方法 ,建立七层模型的主要目的是为解决异种网络互连时所遇到的兼容性问题,其最主要的功能使就是帮助不同类型的主机实现数据传输。OSI采用了分层的结构化技术,共分七层,物理层、数据链路层、网络层、传输层、会话层、表示层、应用层
在这里插入图片描述

  • 物理层:提供为建立、维护和拆除物理链路所需要的机械的、电气的、功能的和规程的特性;有关的物理链路上传输非结构的位流以及故障检测指示。
  • 数据链路层:在网络层实体间提供数据发送和接收的功能和过程;提供数据链路的流控。
  • 网络层:控制分组传送系统的操作、路由选择、拥护控制、网络互连等功能,它的作用是将具体的物理传送对高层透明。
  • 传输层:提供建立、维护和拆除传送连接的功能;选择网络层提供最合适的服务;在系统之间提供可靠的透明的数据传送,提供端到端的错误恢复和流量控制。
  • 会话层:提供两进程之间建立、维护和结束会话连接的功能;提供交互会话的管理功能,如三种数据流方向的控制,即一路交互、两路交替和两路同时会话模式 。
  • 表示层:代表应用进程协商数据表示;完成数据转换、格式化和文本压缩。
  • 应用层:提供OSI用户服务,例如事务处理程序、文件传送协议和网络管理等。

1.2、 HTTP 的工作原理

HTTP(HyperText Transfer Protocol超文本传输协议)是一套计算机通过网络进行通信的规则。HTTP的工作流程可分为四步:

  • 客户端与服务器建立连接。当在浏览器输入网址或当点击链接时,HTTP开始工作。
  • 建立连接后,客户机发送一个请求给服务器,如在浏览器地址栏输入www.baidu.com,浏览器将请求封装成HTTP报文,请求报文的格式为:统一资源标识符(URL)、协议版本号,后边是MIME信息包括请求修饰符、客户机信息和可能的内容。打开浏览器控制台Network,可看到浏览器发送的请求。

在这里插入图片描述

  • 服务器接到请求后,给予相应的响应信息,其格式为一个状态行,包括信息的协议版本号、一个成功或错误的代码,后边是MIME信息包括服务器信息、实体信息和可能的内容。
  • 客户端接收服务器所返回的信息通过浏览器显示在用户的显示屏上,然后客户机与服务器断开连接。

1.3、URI 和常见的协议

  • URL:统一资源定位符,其为URI(统一资源标识符)的一个子集。通过描述资源的位置来描述资源。

  • URN:通过名字来识别资源,和位置无关。

  • 如下几种URI:
    在这里插入图片描述

  • 绝对URI的格式
    在这里插入图片描述

  • 常见的协议以及对应端口号
    (1)FTP 文件传输协议,使用21端口。
    (2)HTTP:超文本传输协议。默认80端口。
    (3)HTTPs:具有安全性的ssl加密传输协议,端口号443
    (4)Telnet:一种用于远程登陆的端口,用户可以远程连接到计算机。通过这种端口可提供一种基于DOS模式下的通信服务。如以前的BBS是纯字符界面的,支持BBS的服务器将23端口打开,对外提供服务。
    (5)SMTP: 简单邮件传送协议,25端口。
    (6)POP3:它是和SMTP对应,POP3用于接收邮件110端口。

1.4、HTTP 协议和服务器交互的方法

HTTP最大的作用就是客户端向服务器发送请求,服务器对其做出响应。客户端向服务器发送请求的方式有很多,简要列举如下:

  • GET。【查】。通常用于请求服务器资源。在浏览器输入网页地址,就是给服务器发送一个get请求,希望得到该网页。
  • POST。【增】。通常用于服务器发送数据,用来支持HTML表单(input、select textarea),表单中的数据会被发送到服务器。
  • HEAD。【查】。与GET方法类似,但在服务器响应中没有资源的内容,只有资源的一些基本信息。主要用处:a. 在不获取资源详情的情况下获取该资源信息,如,类型、大小;b. 通过状态码查看资源是否存;c. 通过查看其首部,测试该资源是否被修改。
  • PUT。【改】。与GET方法相反,PUT用于向服务器写入资源,其语义是让服务器用请求主体部分创建一个请求URL命名的文档,如果存在就替换。
  • TRACE。【查】。客户端发送一个请求的时候,这个请求可能会穿过防火墙、代理、网关和一些其它应用程序,没个中间节点都可能修改HTTP请求,TRACE方法允许客户端在最终请求发往服务器的时候,看看它变成了什么样子。TRACE请求会在目的服务器端发送一个“闭环”诊断,行程最后一站服务器会弹回一条TRACE响应,并在响应主题中携带它收到的原始请求报文。
  • DELETE。【删】。用于要求服务器删除请求的URL,和PUT一样,服务器可能会不支持。
  • OPTIONS。该方法用于请求 web服务器,并告知其支持的各种功能。

1.5、 状态码

HTTP状态码,反映了Web服务器处理HTTP请求的状态。HTTP应答码由3位数字构成,其中首位数字定义应答码的类型

  • 1X - 信息类(Information),表示收到Web浏览器请求,正在进一步的处理中
  • 2X - 成功类(Successful),表示用户请求被正确接收,例如:200 OK成功
  • 3XX - 重定向类(Redirection),表示请求没有成功,客户必须采取进一步的动作。如
    a. 301:永久重定向。Moved Permanently,客户请求的文档在其他地方,新的URL在Location头中给出,浏览器应该自动地访问新的URL
    b. 302:临时重定向。与301状态码类似,但客户端应该使用Location首部给出的URL来零食定位资源,将来的请求仍然使用老的URL。
    b. 304: Not Modified 客户端有缓冲的文档并发出了一个条件性的请求(一般是提供If-Modified-Since头表示客户只想比指定日期更新的文档)。服务器告诉客户,原来缓冲文档仍可继续使用。
  • 4XX - 客户端错误(Client Error),表示客户端提交的请求有错误 例如:404 NOT Found,意味着请求中所引用的文档不存在。
  • 5XX - 服务器错误(Server Error)表示服务器不能完成对请求的处理:如 500 对于我们Web开发人员来说掌握HTTP应答码有。503 Service Unavailable 服务器由于维护或者负载过重未能应答。

2、http报文详解

2.1、报文组成

HTTP报文大致分为报文首部报文主体两块,中间用空行来划分。通常,不一定有报文主体。

  • 报文首部:包含服务器或客户端需处理的请求或响应的内容及属性。
  • 报文主体:应该被发送的数据。

2.2、请求报文首部结构

--请求行:包含用于请求的方法,请求URI和HTTP版本。
--请求首部字段
--通用首部字段
--实体首部字段
--其它

举个栗子,浏览器地址栏输入www.baidu.com,打开控制台,查看Request Headers,看到如下信息:

    GET / HTTP/1.1
    Host: www.baidu.com
    Connection: keep-alive
    Upgrade-Insecure-Requests: 1
    User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.143 Safari/537.36
    Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8
    Referer: https://www.baidu.com/s?wd=HTTP%20%E5%8D%8F%E8%AE%AE%E6%9C%89%E5%87%A0%E7%A7%8D%E5%92%8C.....
    Accept-Encoding: gzip, deflate, sdch, br
    Accept-Language: zh-CN,zh;q=0.8
    Cookie: BIDUPSID=670A04B660AAF2716D3120BEAF946A11; BAIDUID=2454D4....
    RA-Ver: 3.0.8
    RA-Sid: CA623F7A-20150914-060054-2b9722-5fde41
  • 第一行为请求行: GET / HTTP/1.1 方法是GET,协议版本http1.1
  • HOST:请求资源所在服务器
  • Connection keep-alive:一般情况下,web服务器向浏览器发送请求数据后,就要关闭TCP连接,然后若浏览器或者服务器在其头信息加入Connection:keep-alive,则请求数据被发送后仍将保持连接状态。因此,浏览器可继续通过相同连接发送请求。在此保持连接【即长连接】模式下,能节省为每个请求建立新连接所需要的时间,还节约了网络带宽。
  • User-Agent:客户端程序信息,就是发送请求的浏览器信息。
  • Accept:列出了浏览器可以接收的媒体数据类型
    a. 文本文件:text/html, text/palin,text/css,application/xhtml+xml…
    b. 图片文件:image/jpeg, image/gif, image/png…
    c. 视频文件: video/jpeg, video/quicktime…等。
  • Accept-Encoding:浏览器用来告知服务器能够支持的内容编码及内容编码的优先级顺序,可一次性指定多种内容编码。例如:
    a. gzip:有文件压缩程序gzip生成的编码格式。
    b. deflate:组合使用zlib格式和deflate压缩算法生成的编码格式。
    c. sdch: Shared Dictionary Compression over HTTP字典压缩算法。
  • Accept-Language:告知服务器浏览器能够处理的自然语言集(中文、英文等)。zh-CN中文简体。
  • Cookie:浏览器记录的用户相关信息。

2.3、响应报文首部结构

--状态行
--响应首部字段
--通用首部字段
--实体首部字段
--其他

浏览器控制台给出了相应的Reponse Headers:

HTTP/1.1 200 OK
Server: bfe/1.0.8.18
Date: Mon, 16 Jan 2017 06:35:24 GMT
Content-Type: text/html;charset=utf-8
Transfer-Encoding: chunked
Connection: keep-alive
Cache-Control: private
Expires: Mon, 16 Jan 2017 06:35:24 GMT
Content-Encoding: gzip
X-UA-Compatible: IE=Edge,chrome=1
Strict-Transport-Security: max-age=172800
BDPAGETYPE: 2
BDQID: 0xe0042a0200002ea3
BDUSERID: 252528851
Set-Cookie: BDSVRTM=104; path=/
Set-Cookie: BD_HOME=1; path=/
Set-Cookie: H_PS_PSSID=21767_1446_21111_18133_19898_20718; path=/; domain=.baidu.com
Set-Cookie: __bsi=17204004216256107848_00_0_I_R_105_0303_C02F_N_I_I_0; expires=Mon, 16-Jan-17 06:35:29 GMT; domain=www.baidu.com; path=/
  • 第一行状态行:给出了状态码200,表示请求已被正常处理。
  • Server:这是服务器用来告诉客户端当前服务器上安装的HTTP服务器应用程序的信息,可能包含服务器上的软件应用名称,版本号等。
  • Content-Type:此字段标明了服务器返回给浏览器的实体内容的类型是text/html,charset。
  • UTF-8。这部分与请求头中的Accept相对应。
  • Transfer-Encoding: chunked 表示输出的内容长度不能确定,普通的静态页面、图片之类的基本上都用不到这个。动态页面中可能会用到。
  • Cache-Control: 缓存控制,默认值为private,表示内容只缓存到私有缓存中(仅客户端可以缓存,代理服务器不可缓存)。
  • Expires:告知客户端资源失效的日期。当浏览器看到响应中有一个Expires头时,它会和相应的组件一起保存到其缓存中,只要组件没有过期,浏览器就会使用缓存版本而不会进行任何的HTTP请求。Expires设置的日期格式必须为GMT(格林尼治标准时间)。
  • X-UA-Compatible: 设置浏览器兼容模式。 IE=Edge 指定IE浏览器以最新的标准来渲染页面,chrome=1 则可以激活Chrome Frame,将允许站点在使用了谷歌浏览器内嵌框架(Chrome Frame)的客户端渲染,对于没有使用的,则没有任何影响。

2.4、报文主体部分

在刚才访问 www.baidu.com 的例子中,控制台点击 Response,就可以看到服务器返回给浏览器的数据(如下图所示),数据格式为html,浏览器拿到数据后解析渲染成我们所看到的百度首页。

在这里插入图片描述
在百度的搜索栏输入我们想要搜索的数据,例如我输入了百科,刷新观察Network给出的报文信息,我们会发现请求头(Request Headers)后面多了一串数据Query String Parameters(查询字符串参数列表),如图所示,

在这里插入图片描述
在这里插入图片描述
当查询数据时,浏览器将查询数据打包到HTTP请求报文中并发送给服务器。服务器处理完成后,返回给浏览器一串JavaScript的字符串:

jQuery110202691066588863864_1484617221926({"q":"","p":false,"bs":"百科","csor":"0","status":770,"s":[]});

2、一次完整的请求过程

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
以上完整的HTTP请求和响应的七大步骤,其流程大致如下:

①:DNS解析域名得到IP地址

②:客户端与服务器建立连接(TCP三次握手)

③:客户端发起请求

④:服务器接收到请求根据端口号.路径等找到对应资源文件,响应源代码给客户端

⑤:客户端拿到请求到的数据(html页面的源代码),开始解析页面以及请求资源

⑥:客户端渲染页面

⑦:web服务器断开连接(四次挥手)

各步骤的详细过程见链接:https://cloud.tencent.com/developer/article/1573346

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值