HTTP协议学习笔记
HTTP 消息由客户端到服务器的请求和服务器到客户端的响应组成包含请求消息和响应消息两种。HTTP 消息由四部分组成:开始行(在请求消息中又称为请求行,在响应信息中称为状态行),消息报头(可选),空行(只有 CRLF 的行),消息正文(可选)。
一、开始行
开始行分为请求行(请求信息)和状态行(响应信息)
1. 请求行
请求行包含:请求方法、URL、HTTP 版本。如:GET HTTP-URL HTTP-Version
1). 请求方法有如下几种:
-
GET:请求获取URL所标识的资源
-
POST:在URL所标识的资源之后附加新的数据
-
HEAD:请求获取由URL标识的资源的响应消息报头
-
PUT:请求服务器存储一个资源,并用URL标识
-
DELETE:请求删除
-
TRACE:请求服务器回送收到的请求信息,主要用于测试和诊断
-
CONNECT:保留将来使用 OPTION:请求查询服务器的性能
HEAD方法与GET几乎一样,从回应部分来看,HEAD 方法的 HTTP头部包含的信息与 GET 相同。用 HEAD 方法时可以不必传输整个资源内容就能得到 URL 标识的资源的信息,因此该方法常用于测试超链接的有效性。
2).HTTP-URL 是一种特殊类型的 URI,包含了用于查找某个资源的足够的信息。格式如下:http://host[":"port][abs_path]
-
http 表示要通过HTTP协议来定位网络资源
-
host 表示合法的Internet主机域名或者IP地址
-
port 指定一个端口号,为空则使用缺省端口80
-
abs_path 指定请求资源的URI
如果 URL 中没有给出 abs_path,那么当它作为请求 URI 时,必须以"/"的形式给出,通常这个工作浏览器自动帮我们完成。
eg: 输入:www.guet.edu.cn
浏览器自动转换成:http://www.guet.edu.cn/
2、状态行
状态行包含:HTTP 版本、响应状态码(Status-Code)及状态码的文本描述(Reason-Phrase)
1).状态码有如下几种:
-
1xx:指示信息–表示请求已接收,继续处理
-
2xx:成功–表示成功接收
-
3xx:重定向–表示要完成请求必须进行更进一步的操作
-
4xx:客户端错误–请求有语法错误或请求无法实现
-
5xx:服务器错误–服务器未能实现请求
2).常见状态码和状态描述:
-
200–OK //请求成功
-
400–Bad Request //客户端请求有语法错误
-
401–Unauthorized //请求未授权
-
403–Forbidden //服务器收到请求,但是拒绝提供服务
-
404–Not Found //请求资源不存在,如:输入了错误的URL
-
500–Internal Server Error //服务器发生不可预期错误
-
503–Server Unavailable //服务器当前不能处理,一段时间后可能恢复
二、消息报头
消息报头可分为:普通报头、请求报头、响应报头、实体报头。每个报头域都是由 【名字 + “:” + 空格 + 值】 组成。
1.普通报头
在普通报头中,有少数报头域用于所有的请求和响应消息,但并不用于被传输的实体,只用于传输的消息。
eg:Cache-Control 用于指定缓存指令,请求时的缓存指令包括:no-cache(用于指示请求或响应消息不能缓存)
2、请求报头
请求报头允许客户端向服务器端传递请求的附加信息以及客户端自身的信息。常用的请求报头有
-
Accept 请求报头域:用于指定客户端接受哪些类型的信息
-
Accept-Charset 请求报头域:用于指定客户端接受的字符集
-
Accept-Encoding 请求报头域:类似于 Accept,但是它是用于指定可接受的内容编码
-
Accept-Language 请求报头域:类似于 Accept,但是它是用于指定一种自然语言。
-
Authorization 请求报头域:主要用于证明客户端有权查看某个资源。
-
Host 请求报头域:主要用于指定被请求资源的 Internet 主机和端口号,它通常从 HTTP-URL 中提取出来的。
-
User-Agent 请求报头域:允许客户端将它的操作系统、浏览器和其它属性告诉服务器。
3、响应报头
响应报头允许服务器传递不能放在状态行中的附加响应信息,以及关于服务器的信息和对 Request-URI 所标识的资源进行下一步访问的信息。常用的响应报头有
-
Location 响应报头域:用于重定向接受者到一个新的位置
-
Location 响应报头域常用在更换域名的时候。
-
Server 响应报头域:包含了服务器用来处理请求的软件信息。与 User-Agent 请求报头域是相对应的。
-
WWW-Authenticate 响应报头域:必须被包含在401(未授权的)响应消息中,客户端收到401响应消息时候,并发送 Authorization 报头域请求服务器对其进行验证时,服务端响应报头就包含该报头域。
4.实体报头
请求消息和响应消息都可以传送一个实体。一个实体由实体报头域和实体正文组成,但并不是说实体报头域和实体正文要在一起发送,可以只发送实体报头域。实体报头定义了关于实体正文(eg:有无实体正文)和请求所标识的资源的元信息。常用的实体报头有
-
Content-Encoding 实体报头域:用作媒体类型的修饰符,它的值指示了已经被应用到实体正文的附加内容的编码,因而要获得
Content-Type 报头域中所引用的媒体类型,必须采用相应的解码机制。Content-Encoding这样用于记录文档的压缩方法,eg:Content-Encoding:gzip -
Content-Language 实体报头域:描述了资源所用的自然语言。没有设置该域则认为实体内容将提供给所有的语言阅读者。eg:Content-Language:da
-
Content-Length 实体报头域:用于指明实体正文的长度,以字节方式存储的十进制数字来表示。
-
Content-Type 实体报头域:用于指明发送给接收者的实体正文的媒体类型。eg:Content-Type:text/html;charset=GB2312
-
Last-Modified 实体报头域:用于指示资源的最后修改日期和时间。
-
Expires 实体报头域:给出响应过期的日期和时间。为了让代理服务器或浏览器在一段时间以后更新缓存中(再次访问曾访问过的页面时,直接从缓存中加载,缩短响应时间和降低服务器负载)的页面,我们可以使用Expires实体报头域指定页面过期的时间。eg:Expires:Thu,15 Sep 2006 16:23:12 GMT
三、 消息正文
HTTP 请求头和请求正文之间是一个空行,这个行非常重要,它表示请求头已经结束,接下来的是请求正文,HTTP 响应同理。
1.下面是一个 HTTP 请求的例子:
GET/sample.jspHTTP/1.1
Accept:image/gif.image/jpeg,/
Accept-Language:zh-cn
Connection:Keep-Alive
Host:localhost
User-Agent:Mozila/4.0(compatible;MSIE5.01;Window NT5.0)
Accept-Encoding:gzip,deflate
(空行)
请求正文(username=jinqiao&password=1234)
2.下面是一个 HTTP 响应的例子:
HTTP/1.1 200 OK
Server:Apache Tomcat/5.0.12
Date:Mon,6Oct2003 13:23:42 GMT
Content-Length:112
(空行)
响应正文(比如html 代码)