什么是HTTP协议
HTTP协议是一套计算机通过网络进行通信的规则。计算机专家设计出HTTP,使HTTP客户(如Web浏览器)能够从HTTP服务器(Web服务器)请求信息和服务。
HTTP是一种无状态的协议,无状态是指Web浏览器和Web服务器之间的连接不是长久的连接,这说明浏览器向服务器发送一个请求后,服务器给予回应后便会立刻关闭,这个连接随之断开,在服务器端不保留连接的有关信息,可以理解发一次请求就建立一次连接,收到应答便会立刻断开。HTTP连接基于TCP/IP协议,在TCP连接建立成功后才进行数据的传输,由于HTTP是无状态的,可以认为保证数据的收发准确都是靠TCP这套传输机制进行保障的。
总结来说:HTTP遵循请求/应答模型(Request/Response),HTTP连接是一整套连接的过程,而不是某一个步骤。
HTTP传输的类型
HTTP使用内容类型,是指Web服务器向Web浏览器返回的文件都有与之相关的类型。所有这些类型在MIME Internet邮件协议上模型化,即Web服务器告诉Web浏览器该文件所具有的种类,是HTML文档、GIF格式图像、声音文件还是独立的应用程序。大多数Web浏览器都拥有一系列的可配置的辅助应用程序,它们告诉浏览器应该如何处理Web服务器发送过来的各种内容类型。收发过程中始终是指定文件类型进行收发,不会超出以上范围。
HTTP的通讯机制
上文提到,HTTP是基于TCP/IP协议进行传输的,但是TCP/IP并不是全部,一次完整的HTTP通讯应包含一下七个步骤:
1)建立TCP连接
在HTTP工作开始之前,Web浏览器首先要通过网络与Web服务器建立连接,该连接是通过TCP来完成的,该协议与IP协议共同建立了一个面向连接的,安全可靠的网络链接方式,即著名的TCP/IP协议族,HTTP是比TCP更高层次的应用层协议,根据规则,只有低层协议建立之后才能,才能进行更层协议的连接,因此,首先要建立TCP连接,一般TCP连接的端口号是80,HTTP传输数据依赖下层协议,所以使用了TCP(为什么不使用UDP因为UPD不可靠,无连接,无法保证浏览器与服务器真正连接成功)
(2)Web浏览器向Web服务器发送请求命令
一旦建立了TCP连接,Web浏览器就会向Web服务器发送请求命令
例如:GET/sample/hello.jsp HTTP/1.1
这里表示:使用GET的方法,/sample/hello.jsp是URI,这个文件,HTTP的版本是1.1
(3)Web浏览器发送请求头信息
浏览器发送其请求命令之后,还要以头信息的形式向Web服务器发送一些别的信息(或者说浏览器自己的信息),之后浏览器发送了一空白行来通知服务器,它已经结束了该头信息的发送,所以在TCP连接成功后并不是直接进行数据的传送,还要发送头部信息,头部信息一般由HTTP版本号,Connection标记位,浏览器的字符集,浏览器的编码方法,浏览器的语言等。
请求格式分为三段,发送分别是请求方法,请求头和请求正文,对应七步中的(2)(3)(6)
(4)Web服务器应答
客户机向服务器发出请求后,服务器会客户机回送应答,
HTTP/1.1 200 OK
应答的第一部分是协议的版本号和应答状态码,这里是回复浏览器是正常的状态码200
(5)Web服务器发送应答头信息
请求头信息是浏览器在发送请求时附带的自身信息,Web服务器也会在收到请求头信息后回发给浏览器自己的信息,其中包括Web服务器遵循的缓存机制,Connection标记位,Web服务器使用了何种压缩方法,服务器响应的对象语言等一系列服务器的自身信息。
(6)Web服务器向浏览器发送数据
Web服务器向浏览器发送头信息后,它会发送一个空白行来表示头信息的发送到此为结束,接着,它就以Content-Type应答头信息所描述的格式发送用户所请求的实际数据
(7)Web服务器关闭TCP连接
一般情况下,一旦Web服务器向浏览器发送了请求数据,它就要关闭TCP连接,如果浏览器或者服务器在其头信息中,Connection标记位是keep-alive时
TCP连接在发送后将仍然保持打开状态,于是,浏览器可以继续通过相同的连接发送请求。保持连接节省了为每个请求建立新连接所需的时间,还节约了网络带宽。
HTTP的请求格式和应答格式
接下来分别介绍HTTP请求格式和HTTP应答格式。
请求格式分为三个部分:
l 请求方法URI协议/版本
l 请求头(Request Header)
l 请求正文
分别对应上述七个步骤的(2)(3)(6)
给出一个例子:
GET/sample.jspHTTP/1.1
Accept:image/gif.image/jpeg,*/*
Accept-Language:zh-cn
Connection:Keep-Alive
Host:localhost
User-Agent:Mozila/4.0(compatible;MSIE5.01;Window NT5.0)
Accept-Encoding:gzip,deflate
username=jinqiao&password=1234
这里的请求头部和请求正文用一个空行隔开,是双方的一种约定,表示头部信息已经发送完毕,之后发送的便是数据正文。
(1)请求方法URI协议/版本
请求的第一行是“方法URL议/版本”:GET/sample.jsp HTTP/1.1
以上代码中“GET”代表请求方法,“/sample.jsp”表示URI,“HTTP/1.1代表协议和协议的版本。
根据HTTP标准,HTTP请求可以使用多种请求方法。例如:HTTP1.1支持7种请求方法:GET、POST、HEAD、OPTIONS、PUT、DELETE和TARCE。在Internet应用中,最常用的方法是GET和POST。
URL完整地指定了要访问的网络资源,通常只要给出相对于服务器的根目录的相对目录即可
根目录的一般表示方法是“/”,更加具体的来说URL就是服务器上的一部分资源,一个路径指向访问的资源的具体位置。
(2)请求头(Request Header)
请求头包含许多有关的客户端环境和请求正文的有用信息。例如,请求头可以声明浏览器所用的语言,请求正文的长度等。
Accept:image/gif.image/jpeg./
Accept-Language:zh-cn
Connection:Keep-Alive
Host:localhost
User-Agent:Mozila/4.0(compatible:MSIE5.01:Windows NT5.0)
Accept-Encoding:gzip,deflate.
(3)请求正文
请求头和请求正文之间是一个空行,这个行非常重要,它表示请求头已经结束,接下来的是请求正文。请求正文中可以包含客户提交的查询字符串信息:
username=jinqiao&password=1234
在以上的例子的HTTP请求中,请求的正文只有一行内容。当然,在实际应用中,HTTP请求正文可以包含更多的内容。
应答格式也分为三个部分
l 协议状态版本代码描述
l 响应头(Response Header)
l 响应正文
三个部分对应于上述七个步骤的(4)(5)(6)
给出一个例子:
响应正文和响应头之间也是使用一个空行隔开
HTTP/1.1 200 OK
Server:Apache Tomcat/5.0.12
Date:Mon,6Oct2003 13:23:42 GMT
Content-Length:112
<html>
<head>
<title>HTTP响应示例<title>
</head>
<body>
Hello HTTP!
</body>
</html>
七步中的第四步:HTTP/1.1 200 OK 给浏览器发送应答,内容是使用的HTTP协议版本和应答状态码,200表示服务器成功处理浏览器的请求
响应头部是七步中的第五步:服务器回发给浏览器自身的状态和相关信息,例如遵循的编码格式,服务器的时间,Content-Type的对象类型(例如text/html,jpg/html),对象长度等等有用的信息。
响应正文不必多说,返回给浏览器应答的HTML页面,也就是浏览器最终看到的效果。