概念:
HTTP(Hyper Text Transfer Protocol,超文本传输协议),是一种从万维网服务器传输文本到本地浏览器的传输协议。例如在web应用中,服务器白网页传给浏览器,实际上就是把网页的HTML代码发送给浏览器,然后通过浏览器显示出来。因此,http是在网络上传输HTML的协议,用于浏览器和服务器之间的通信。
HTTP是基于TCP/ip协议栈来传递数据(包括HTML文件,图片文件,查询结果等)。其是一种属于应用层面向对象的协议,由于其简洁、快速的方式,适用于分布式超媒体信息系统。
HTTP主要特点:
- 简单快速:客户端再向服务器发送请求服务是,只需要传送请求方法及路径。常用的请求方法包括GET、HEAD、POST等,每种方法规定了客户与服务器联系的类型。
- 灵活:HTTP允许传输任意类型的数据对象,正在传输的数据类型有content-type加以标识。
- 无连接:无连接的含义是限制每次链接只处理一个请求,服务器处理完客户的请求并收到客户的应答以后即断开链接。采用这用方式可以节省传输时间。
- 无状态:HTTP协议是无状态协议。无状态协议是指对事物处理没有记忆能力,这就意味着如果处理后续事物时加入需要用到前面的信息,则必须在重传一次,这样可能导致每次连接传送的数据量增大。但是另外一方面,在服务器不需要先前信息时它的应答会更快(个人认为减少了先前信息的处理时间导致响应速度会更快)。
- 支持B/S和C/S模式,即浏览器/服务器、客户端/服务器模式。
URL理解:
网络上的各种资源都是通过URL即统一资源定位符来进行定位和标记的,它相当于一个资源的身份证,能够唯一标记出一个资源。URL包括协议部分、域名部分、端口部分(可选)、虚拟目录部分(可选)、文件名部分(可选)、锚部分(可选)、参数部分(可选)。即除了协议部分和域名部分,其它参数都是可选的。下面具体介绍一下各部分的内容:
以 https://bytedance.feishu.cn/space/doc/doccnjN17b2wG3CUN9SySt#为例
- 协议部分:该部分指明了应用层的传输协议,如HTTP还是HTTPS,以//分隔符结束。
- 域名部分:bytedance.feishu.cn,一个URL中,也可以使用IP作为域名使用(反正域名就是IP的别名)。
- 端口部分,本例中没有指明端口。HTTP服务器,默认的端口号为80/tcp;HTTPS(securely transferring web pages)服务器,默认的端口号为443/tcp 443/udp。
- 虚拟目录部分:从域名第一个“/”开始到最后一个“/”为止,是虚拟目录部分,比例中的虚拟目录部为:/space/doc/。
- 文件名部分:从域名后的最后一个“/”开始,是文件名部分,如果没有“?”,则是从域名后的最后一个“/”开始到“#”为止,是文件名部分。如果“?”和“#”都没有,则后面的全部都是文件名。文件名也不是URL必须的部分,如果没有指定文件名,则使用默认文件名。本例中文件名为doccnjN17b2wG3CUN9SySt。
- 锚部分(位置标志符):从“#”开始到最后,都是锚部分。锚部分代表中网页中的一个具体位置。
- 参数部分:从“?”到“#”之间的部分为参数部分,又称为搜索部分、查询部分。参数允许有多个子参数,自参数之间用&连接。
请求消息和响应消息:
- 请求消息request:
- 客户端向服务器发送一个请求消息包括以下内容:请求行、请求头部、空行和请求数据。再来说说各部分的具体内容。
- 请求行:用来说明请求类型(如get,head,post等),要访问的资源(通过URL定位)以及所使用的HTTP版本(1.0、1.1等)。
- 请求头部:紧接着请求行之后的部分,即第一行以后的部分,用来说明服务器要使用的附加信息,如host主机名,use-Agent浏览器基本资料,Accept浏览器能量识别的响应类型,Accept-language浏览器能够识别的语言,Accept-Encoding浏览器能够识别的压缩方式,referer来路页面,connection是否保持连接等。
- 空行:请求头部后面的空行是必须的,即使第四部分的请求数据为空,也必须包含有空行。
- 请求数据:也被称为请求体,其中可以添加任意的数据,也可以为空。
响应消息Response:
一般情况下,服务器响应HTTP请求后会返回给客户端一个HTTP响应消息,响应消息也包括四个部分:状态行、消息包头、空行、响应正文。
- 状态行:由HTTP协议版本号、状态码、状态消息组成。
- 消息报头:用来说明客户端要使用的一些附加信息。Date:生成响应的日期和时间;Content-Type:指示响应的内容,指定了MIME类型的HTML(text/html),编码类型是UTF-8
- 空行:必须
- 响应正文:服务器返回给客户端的文本信息。空行后面的HTML为响应正文。
请求 | 响应 |
请求行 | 状态行 |
请求头部 | 消息报头 |
空行 | 空行 |
请求数据 | 响应数据 |
请求方法:
HTTP1.0定义了三种方法:GET、HEAD、POST
HTTP1.1新增;额五中请求方法:OPTIONS、PUT、DELETE、TRACE和CONNECT方法。
GET方法用于请求指定的页面信息,并返回实体主体。
HEAD方法类似于get请求,只不过返回的响应中没有具体内容,用于获取报头。
POST向指定资源提交数据进行处理请求,数据被包含在请求体中,post请求可能导致新的资源的建立或以后资源的修改。
PUT方法从客户端向服务器传送的数据取代指定的文档的内容。
DELETE请求服务器删除指定的页面。
GET和POST的主要区别:
1、GET请求中,请求的数据会被附在URL之后,即把数据放置在HTTP的请求行中。如果是英文字母或数字,则原样发送,空格转换为“+”,如果是中文或其他字符,则用BASE64加密,并用16进制的ascll码表示。
2、POST请求中,会把请求的数据放置在请求数据中,并不会被附在URL之后。因此GET请求的数据会在地址栏显示出来,而POST请求不会。
3、传输数据的大小,HTTP协议并没有对传输数据的大小进行限制,也米有对URL的长度进行限制,但在实际开发中存在的限制主要还有:
- GET请求中特定服务器和浏览器对URL的长度限制。
- POST请求中,由于不是通过URL传递数据,理论上不受限,但是哥哥web服务器会规定对post提交的数据大小进行限制。
4、安全性:POST的安全性更高。
5、GET方式使用Request.QueryString来获取变量的值,而POST方式通过Request.Form来获取变量的值。
HTTP与HTTPS的区别:
HTTP协议传输的数据都是未加密的,也就是明文的,因此使用HTTP协议传输隐私信息很不安全,为了保证隐私信息能够加密传输,网景公司设计了SSL(Secure Sockets layer)协议用于对HTTP协议传输的数据进行加密,从而诞生了HTTPS。
关于Connection:keep-alive:
HTTP协议采用请求应答模式,为非keep alive,每个请求应答都要和服务器建立一个新的连接,完成之后立即断开连接。当使用keep alive时,keep alive功能是客户端到服务器之间的连接持续有效,当出现对服务器的后续请求是,keep alive功能避免了建立或者重新建立连接。启用keep-alive模式更高效。
短连接
所谓短连接,及连接只保持在数据传输过程,请求发起,连接建立,数据返回,连接关闭。它适用于一些实时数据请求,配合轮询来进行新旧数据的更替。
长连接
长连接便是在连接发起后,在请求关闭连接前客户端与服务端都保持连接,实质是保持这个通信管道,之后便可以对其进行复用。
它适用于涉及消息推送,请求频繁的场景(直播,流媒体)。连接建立后,在该连接下的所有请求都可以重用这个长连接管道,避免了频繁了连接请求,提升了效率。
使用HTTP建立长连接
当需要建立 HTTP 长连接时,HTTP 请求头将包含如下内容:
Connection: Keep-Alive
如果服务端同意建立长连接,HTTP 响应头也将包含如下内容:
Connection: Keep-Alive
当需要关闭连接时,HTTP 头中会包含如下内容:
Connection: Close
在Keep-alive中客户端如何判断服务器发送的消息已经结束?
1、可以根据消息首部字段Content-length来进行判断。
2、使用消息首部字段Transfer-Encoding:chunk模式传递数据(动态页面的传输方式)
具体参考:
https://www.cnblogs.com/skynet/archive/2010/12/11/1903347.html