超文本传输协议HTTP(一)

本文介绍了用于支持WWW浏览的HTTP协议的基本概念及其发展历程。包括常见的请求方法GET、POST和HEAD的使用方式,以及服务器如何处理这些请求。同时探讨了HTTP1.1中引入的持续连接特性以提高效率。

用于支持WWW浏览的网络协议为HTTP,这是一种最基本的客户机/服务器的访问协议。
浏览器向服务器发送请求,而服务器回应相应的网页。HTTP协议从1990年开始出现,发展
到当前的HTTP
1.1标准,已经有了相当多的扩展,然而其最基本的实现是非常简单的,服务器需要进行
的额外处理相当少,这也是为什么Web服务器软件如此众多的原因之一。


请求方法

通常,HTTP协议使用端口80来提供客户访问,因此也可以使用其他的网络软件,如telnet
,模拟客户向服务器发送请求,来查看HTTP的传输方式。

$telnetwebserver80
Trying192.168.0.1...
Connectedtowebserver.
Escapecharacteris'^]'.
GET/index.html



  当telnet显示了Connect等信息建立了连接之后,服务器就等待使用者输入请求,而
不进行任何提示。上例中,使用者输入GET/index.html指令,则服务器立即将相应的网
页返回,然后关闭连接。

  客户程序向服务器发送的请求可以有不同的类型,这样服务器可以根据不同的请求类
型进行不同的处理。在HTTP1.0中,定义了三种最基本的请求类型,GET、POST和HEAD,
这些请求方法的实现方式均与上例相同,客户程序用大写指令将请求发送给服务器,后面
跟随具体的数据。

  GET请求最为常见,它后面跟随一个网页的位置,服务器接受请求并返回其请求的页
面。除了页面位置作参数之外,请求还可以跟随协议的版本如HTTP/1.0等作为参数,以发
送给服务器更多的信息。

  POST请求要求服务器接收大量的信息,除了POST后面跟随的参数之外,浏览器还会在
后面持续发送数据,让服务器进行处理。通常,POST方法是和CGI程序分不开的,服务器
应该启动一个CGI程序来处理POST发送来的数据。

  HEAD请求在客户程序和服务器之间进行交流,而不会返回具体的文档。当使用GET和
POST方法时,服务器最后都将结果文档返回给客户程序,浏览器将刷新显示。而HEAD请求
则不同,它仅仅交流一些内部数据,这些数据不会影响浏览的过程。因此HEAD方法通常不
单独使用,而是和其他
的请求方法一起起到辅助作用。一些搜寻引擎使用的自动搜索机器人使用这个方法来获得
网页的标志信息,或者进行安全认证时,使用这个方法来传递认证信息。

  除了这三种最常见的访问方法之外,在HTTP
1.1中还定义了更多的访问方法类型,如PUT,用于将网页放置到正确位置,DELETE用于删
除相关文档等。这些方法并不常用,因而大部分Web服务器软件并没有实现他们。然而对
于特定场合他们还是非常有用的,例如使用软件编辑网页时,网页编辑器可以使用这些方
法,管理不同的网页。

  如果服务器不支持客户发送的请求方法,服务器将返回错误并立即关闭连接。


服务器对HTTP的处理方式

  HTTP协议的这种请求/回应的模式,使得服务器只能根据客户程序的请求发送回信息
,这样的好处是客户具备很大的自由度,可以任意访问服务器上的信息。因此就存在多个
客户同时访问一个服务器的问题。

  在Unix下,由一个守护进程来监视来自客户程序的请求,当守护进程接受到一个请求
时,就建立一个新的进程对请求进行处理。通常服务器能创建足够多的新进程来回应客户
的请求,然而如果同时发送请求的客户太多,那么服务器就有可能出现超载的情况,创建
进程的速度跟不上众多
客户发送请求的速度,这样就造成了服务器对外表现反应迟缓。此外,为了提高用户使用
浏览器时的性能,现代浏览器还支持并发的访问方式,浏览一个网页时同时建立多个连接
,以迅速获得一个网页上的多个图标,这样能更快速完成整个网页的传输。但是对服务器
来讲,更增加了瞬间负
载。

  显然,造成这个问题的关键是服务器对HTTP协议的处理方式,一次请求就要建立一个
连接,在网页上充满了多个较小的图象文件的时候,那么服务器和客户程序之间的大部分
工作是用于建立连接,而真正用于传递数据的工作却很轻松。因此,更好的利用现有连接
,减少建立连接的消耗
,就需要能在一次连接中回应多个请求。在HTTP1.1中提供了这种持续连接的方式,而下
一代HTTP协议:HTTP-NG更增加了有关会话控制、丰富的内容协商等方式的支持,来提供
更高效率的连接。

  除了针对每次请求都建立一个新进程的处理方式之外,HTTP守护进程也能使用其他的
方式处理多个请求,例如使用多线程,或者使用异步方式在不同请求之间进行切换,就能
在一个进程内处理多个请求。虽然比起建立新进程来讲,这样消耗的处理器资源略微减少
,但是并不能从根本上
消除并发访问带来的处理器资源不足的问题。一般使用线程和异步方式的程序较为复杂,
不能很容易扩充对新特性的支持,并有可能因为程序内部要自己进行同步等原因也会造成
资源消耗。使用这些方式,虽然对处理静态的网页有好处,但对于执行CGI程序,仍然要
创建子进程进行处理。
因此,大部分运行在Unix上的守护程序仍然使用多进程的方式,这种方式简单却有效。

  即使对于使用多进程方式进行处理的Web服务器,也有不同的处理方式。Unix系统中
提供了超级服务器进程inetd,因此简单的Web服务器可以使用inetd来启动真正的Web服
务器。然而,inetd效率不高,使用in
etd的服务器不能用作高负载的服务器系统,因此高负载的Web服务器,本身来监听客户连
接请求,并负责启动子进程真正处理客户的请求。

  如果选择的服务器程序的确需要使用inetd来启动,可以选择与inetd功能相同,但效
率更高的超级服务器进程tcpserver,它可以比inetd更高效的启动服务进程。

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值