HTTP协议的作用原理包括四个步骤: (1) 连接:Web浏览器与Web服务器建立连接,打开一个称为socket(套接字)的虚拟文件,此文件的建立标志着连接建立成功。 (2) 请求:Web浏览器通过socket向Web服务器提交请求。HTTP的请求一般是GET或POST命令(POST用于FORM参数的传递)。GET命令的格式为: GET 路径/文件名 HTTP/1.0 文件名指出所访问的文件,HTTP/1.0指出Web浏览器使用的HTTP版本。 (3) 应答:Web浏览器提交请求后,通过HTTP协议传送给Web服务器。Web服务器接到后,进行事务处理,处理结果又通过HTTP传回给Web浏览器,从而在Web浏览器上显示出所请求的页面。 例:假设客户机与 www.mycompany.com:8080/mydir/index.html建立了连接,就会发送GET命令:GET /mydir/index.html HTTP/1.0。主机名为 www.mycompany.com的Web服务器从它的文档空间中搜索子目录mydir的文件index.html。如果找到该文件,Web服务器把该文件内容传送给相应的Web浏览器。为了告知 Web浏览器传送内容的类型,Web服务器首先传送一些HTTP头信息,然后传送具体内容(即HTTP体信息),HTTP头信息和HTTP体信息之间用一个空行分开。 常用的HTTP头信息有: ① HTTP 1.0 200 OK 这是Web服务器应答的第一行,列出服务器正在运行的HTTP版本号和应答代码。代码"200 OK"表示请求完成。 ② MIME_Version:1.0 它指示MIME类型的版本。 ③ content_type:类型 这个头信息非常重要,它指示HTTP体信息的MIME类型。如:content_type:text/html指示传送的数据是HTML文档。 ④ content_length:长度值 它指示HTTP体信息的长度(字节)。 (4) 关闭连接:当应答结束后,Web浏览器与Web服务器必须断开,以保证其它Web浏览器能够与Web服务器建立连接。 http协议分析 一、HTTP协议简述 二、HTTP协议通信过程 1、URL自动解析 例如:输入 www.163.com;浏览器会自动转换成: HTTP://www.163.com/
2、获取IP,建立TCP连接
当获取IP之后,就开始与所请求的Tcp建立三次握手连接,连接建立后,就向服务器发出HTTP请求。 3、客户端浏览器向服务器发出HTTP请求 4、Web服务器应答,并向浏览器发送数据 HTTP/1.1 200 OK 5、Web服务器关闭TCP连接 Connection:keep-alive 三、实例分析HTTP通信 下面我们访问 http://www.google.cn/ 1、 运行HTTP Analyzer,选择菜单Action—start开始抓包; 2、 浏览器中输入 l 抓包结果和文件头信息(下图) l 一次请求的html正文内容 l 本次请求是否存在cookies信息 l 一次请求的整个数据包信息,包括头信息和正文。 .
下面我们来详细分析HTTP的请求和响应信息:
1)HTTP请求消息,当客户端和服务端建立TCP连接后,客户端就会向服务器发送一个请求信息, 如: [1] GET / HTTP/1.1 [2] Accept: image/gif, image/x-xbitmap, image/jpeg, image/pjpeg, application/x-shockwave-flash, application/x-silverlight, application/vnd.ms-excel, application/vnd.ms-powerpoint, application/msword, */* 客户端可识别的内容类型列表。 [3] Accept-Language: zh-cn 客户端所能解释的语言:简体中文 [4] UA-CPU: x86 [5] Accept-Encoding: gzip, deflate 客户端可以解释的类型 [6] User-Agent: Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; Maxthon; EmbeddedWB 14.52 from: [7] Host: [8] Connection: Keep-Alive TCP连接保持打开 [9] l 请求方法URI协议/版本:以上代码第[1]行“GET”表示请求方法,,“HTTP/1.1代表协议和协议的版本,HTTP请求可以使用多种请求方法,最常用的为GET和POST方法 l 请求头:[2]-[8]行,包含许多有关客户端环境和请求正文的有用信息。 l 空行 :[9] 请求头和请求正文之间是一个空行,这个行非常重要,表示请求头已经结束,接下来是正文,这个行非常重要,它表示请求头已经结束,接下来是请求正文。 l 请求正文。请求正文中可以包含客户提交的查询字符串信息,如用户名和密码等。这里没有。 这里有一点值得说明的是:请求方法中的GET和POST方法; 2)HTTP响应消息,响应跟请求类似,如: [1]HTTP/1.1 200 OK [2]Cache-Control: private, max-age=0 [3]Date: Fri, 27 Feb 2009 07:53:36 GMT [4]Expires: -1 [5]Content-Type: text/html; charset=UTF-8 [6]Set-Cookie: PREF=ID=cc4a31ab6792ef2c:NW=1:TM=1235721216:LM=1235721216:S=q1hQBu-1KdamAWK-; expires=Sun, 27-Feb-2011 07:53:36 GMT; path=/; domain=.google.cn [7]Cont ent-Encoding: gzip [8]Server: gws [9]Transfer-Encoding: chunked [10] [11]ddc 该响应信息也以对应的4部分组成: 1XX-信息类(Information),表示收到Web浏览器请求,正在进一步的处理中 2XX-成功类(Successful),表示用户请求被正确接收,理解和处理例如:200 OK 3XX-重定向类(Redirection),表示请求没有成功,客户必须采取进一步的动作。 4XX-客户端错误(Client Error),表示客户端提交的请求有错误 例如:404 NOT Found,意味着请求中所引用的文档不存在。 5XX-服务器错误(Server Error)表示服务器不能完成对请求的处理:如 500 l 响应头:跟请求头一样,它指出服务器的功能,标识出响应数据的细节。 l 空行:也是属于响应头和响应正文之间必须存在的一个空行,表示响应头结束,接下来是响应正文 l 响应正文:也就是服务器返回的网页内容。 根据上文的描述,再结合工具实际验证一回,相信应该能对HTTP协议和其通信流程有个大致的了解。 |
http协议原理
最新推荐文章于 2025-03-07 21:28:07 发布