一、web交互的基本流程
客户端根据用户输入的地址信息请求服务器,服务器在接收到用户的请求后进行处理,然后将处理结果响应给客户端,客户端将响应结果展示给用户。
专业术语:
请求:
客户端根据用户地址信息将数据发送给服务器的过程。
响应:
服务器将请求的处理结果发送给浏览器的过程。
提出问题:
客户端也就是浏览器有很多的版本,服务器也有很多的版本,如何实现不同版本间的浏览器和服务器之间的数据交互呢?
解决方法:
规范浏览器和服务器的数据交互格式。
实现:HTTP协议
二、HTTP的概念和介绍
概念:HTTP是超文本传输协议(Hyper Text Transfer Protocol)
作用:规范了浏览器和服务器之间的数据交互
特点:
简单快速:
客户向服务器请求服务时,只需要传送请求方法和路径。请求方法通常有GET,HEAD、POST。每种方法规定了客户与服务器联系的类型 。由于HTTP协议简单,使得HTTP服务器的程序规模小,因而通信速度快。
灵活:
HTTP允许传输任意类型的数据对象。正在传输的类型由Content-Type加以标记。
无连接:
无连接的含义是限制每次连接只处理一个请求。服务器处理完客户的请求,并受到客户的应答后,即断开连接。采用这种方式可以 节约传输时间。
无状态:
HTTP协议是无状态协议。无状态指的是对于事务处理没有记忆能力。缺少状态意味着如果后续处理需要前面的信息,则它必须重传,这样可能导致每次连接传送的数据量增大。另一方面,在服务器不需要先前信息时它的应答就比较块。
支持客户/服务器模式
HTTP1.1版本后支持可持续连接。
三、HTPP的交互流程:
HTTP的交互流程一般分为四个步骤(一次完整的请求):
步骤一:
客户端和服务器建立连接
步骤二:
客户端发送请求数据 到服务器端(HTTP协议)‘
步骤三:
服务器接受请求后,进行处理,然后将处理结果响应给客户端(HTTP协议)
步骤四:
关闭客户端和服务器的链接(HTTP1.1后不会立即关闭)
四、HTTP协议的请求格式
请求格式的结构:
请求头:请求方式、请求地址和HTTP协议版本
请求行:消息报头,一般用来说明客户端要使用的一些附加信息
空行:位于请求行和请求数据之间,空行是必须的。
请求数据:非必须。
注意:一张网页的内容是集齐丰富的,浏览器会遵循HTTP请求的格式将有效的数据发送给服务器。
五、HTTP协议之请求方式
根据HTTP标准,HTTP请求可以使用多种请求方法。
HTTP 1.0定义了三种请求方法:GET、POST和HEAD方法。
HTTP1.1新增了五种请求方法:OPTIONS、PUT、DELETE、TRACE和CONNECT方法。
GET:请求指定的页面信息,并返回实体主体
HEAD:类似与GET请求,只不过返回的响应中没有具体的内容,用于获取报头
POST:向指定资源提交数据进行处理请求(例如提交表单或者上传文件)。数据被包含在请求体中。POSt请求可能会导致新的资源的建立或已有资源的修改。
PUT:从客户端向服务器传送的数据取代指定的文档的内容。
DELETE:请求服务器删除指定的页面。
CONNECT:HTTP1.1协议中预留给能够将连接改为管道方式的代理服务器
OPTIONS:允许客户端查看服务器的性能。
TRACE:回显服务器收到的请求,主要用于测试和诊断。
get和post请求方式的区别:
get请求方式:
请求数据会以?的形式隔离拼接在请求头中,不安全,没有请求实体部分。
HTTP协议虽然没有规定请求数据的大小,但是浏览器对URL的长度是有限制的,所以get请求不能携带大量的数据。
post请求方式:
主要用于向web服务器程序提交form表单中的数据:form表单的method置为post
请求数据在请求实体中发送,在URL中看不到具体的请求数据,安全,适合数据量大的数据发送。
六、HTTP协议之响应
HTTP响应包括一个首部和一个体。首部信息告诉浏览器使用了什么协议,请求是否成功,以及体中包括的内容是什么类型。体包含了要让浏览器显示的具体内容。
内容类型响应首部的值称为MIME类型。MIME类型告诉浏览器要接收的数据是什么类型,这样浏览器才知道如何显示这些数据。要注意,MIME类型值与HTTP请求的“Accept”首部中所列的值相关。
响应格式的结构:
响应行(状态行):HTTP版本、状态码、状态消息
响应头:消息报头,客户端使用的附加信息。
空行:响应头和响应实体之间的,必须的。
响应实体:正文,服务器返回给 浏览器的信息。
HTTP常见响应状态码含义:
HTTP状态码由三个十进制数字组成。第一个十进制数字定义了状态码的类型,后两个数字没有分类的作用。HTTP状态码共分为5种类型:
分类 | 分类描述 |
---|---|
1** | 信息,服务器收到请求,需要请求者继续执行操作 |
2** | 成功,操作被成功接受并处理 |
3** | 重定向,需要进一步操作以完成请求 |
4** | 客户端错误,请求包含语法错误或无法完成请求 |
5** | 服务器错误,服务器在处理请求的过程中发生了错误 |
常见状态码:
200 OK 客户端请求成功
400 Bad Request 客户端有语法错误,不能被服务器所理解
401 Unauthorized 请求未经授权,这个状态码必须和WWW-Authenticate 报头域一起使用
403 Forbidden 服务器收到请求,但是拒绝提供服务
404 Not Found 请求资源不存在。例如:输入了错误的URL
500 Internal Server Error 服务器发生不可预期的错误
503 Server Unavailable 服务器不能处理客户端的请求,一段时间后可能恢复正常
七、URL
URL(统一资源定位符)
1:协议:告诉服务器使用什么通信协议(这里是HTTP)
2:服务器:所请求物理服务器唯一的名字。这个名字映射到一个唯一的IP地址。IP地址是一个数字,形式为“xxx.yyy.zzz.aaa”.。在这里也可以指定一个ip地址而不是服务器名,服务器名更容易记。
3:端口:URL的这一部分是可选的。一个服务器可以支持多个端口,一个服务器应用有一个端口标识。如果在URL中没有指定端口,默认端口为80。
4:路径:所请求的资源在服务器上的所在路径。
5:资源:所请求内容的名字。可以是一个HTML页面,一个servlet、一个图像、PDF、或服务器能提供的任何资源。这部分是可选的,如果URL中没有这一部分,大部分文本服务器都会默认的查找index.html.
可选的查询串:要记住,如果这是一个GET请求,额外的信息(参数)会追加到这个URL的最后,以一个问号“?”开头,各个参数(名/值对)之间有一个“&”分隔。