HTTP协议-理论篇

HTTP协议-理论篇

1. Socket套接字

套接字Socket是进程间通信IPC的一种实现,允许位于不同主机(或同一主机)上不同进程之间进行通信和数据交换,SocketAPI出现于1983年,4.2 BSD实现.
在建立通信连接的每一端,进程间的传输要有两个标志:IP地址和端口号,合称为套接字地址 socket
address

客户机套接字地址定义了一个唯一的客户进程
服务器套接字地址定义了一个唯一的服务器进程

套接字相关的系统调用

  • socket() 创建一个套接字
  • bind() 绑定IP和端口
  • listen() 监听
  • accept() 接收请求
  • connect() 请求连接建立
  • write() 发送
  • read() 接收
  • close() 关闭连接

2. HTTP 超文本传输协议

2.1 HTTP通信过程

img

2.2 WEB开发语言

html
css
javascript

HTML

Hyper Text Markup Language 超文本标记语言,编程语言,主要负责实现页面的结构
范例:html 语言

<html>
<head>
<meta http-equiv=Content-Type content="text/html;charset=utf-8">
<title>HTML语言</title>
</head>
<body>
<img src="http://www.magedu.com/wp-content/uploads/2017/09/logo.png" >
<h1 style="color:red">欢迎</h1>
<p><a href=http://www.magedu.com>马哥教育</a>欢迎你</p>
</body>
</html>
CSS

Cascading Style Sheet 层叠样式表, 定义了如何显示(装扮) HTML 元素,比如:字体大小和颜色属性等。样式通常保存在外部的 .css 文件中。通过仅仅编辑一个简单的 CSS 文档,可以同时改变站点中所有页面的布局和外观。

#test.html
<html>
<head>
<meta http-equiv=Content-Type content="text/html;charset=utf-8">
<link rel="stylesheet" type="text/css" href="mystyle.css" />
</head>
<body>
<h1>这是 heading 1</h1>
<p>这是一段普通的段落。请注意,该段落的文本是红色的。在 body 选择器中定义了本页面中的默认文本颜
色。</p>
<p class="ex">该段落定义了 class="ex"。该段落中的文本是蓝色的。</p>
</body>
</html>

#mystyle.css
body {color:red}
h1 {color:#00ff00}
p.ex {color:rgb(0,0,255)}
JS

javascript,实现网页的动画效果

<!DOCTYPE html>
<html>
<head>
<meta http-equiv=Content-Type content="text/html;charset=utf-8">
</head>
<body>
<h2>我的第一段 JavaScript</h2>

<button type="button"
onclick="document.getElementById('demo').innerHTML = Date()">
点击这里来显示日期和时间
</button>

<p id="demo"></p>
</body>
</html>
MIME

Multipurpose Internet Mail Extensions 多用途互联网邮件扩展,对应文件 /etc/mime.types

MIME格式:major/minor

2.3 URI和URL

img

URL组成
<scheme>://<user>:<password>@<host>:<port>/<path>;<params>?<query>#<frag>
  • scheme:方案,访问服务器以获取资源时要使用哪种协议
  • user:用户,某些方案访问资源时需要的用户名
  • password:密码,用户对应的密码,中间用:分隔
  • Host:主机,资源宿主服务器的主机名或IP地址
  • port:端口,资源宿主服务器正在监听的端口号,很多方案有默认端口号
  • path:路径,服务器资源的本地名,由一个/将其与前面的URL组件分隔
  • params:参数,指定输入的参数,参数为名/值对,多个参数,用;分隔
  • query:查询,传递参数给程序,如数据库,用?分隔,多个查询用&分隔
  • frag:片段,一小片或一部分资源的名字,此组件在客户端使用,用#分隔

2.4 网站访问量

网站访问量的重要指标
  • IP(独立IP):即Internet Protocol,指独立IP数。一天内来自相同客户机IP 地址只计算一次,记录远
    程客户机IP地址的计算机访问网站的次数,是衡量网站流量的重要指标
  • PV(访问量): 即Page View, 页面浏览量或点击量,用户每次刷新即被计算一次,PV反映的是浏览
    某网站的页面数,PV与来访者的数量成正比,PV并不是页面的来访者数量,而是网站被访问的页
    面数量
  • UV(独立访客):即Unique Visitor,访问网站的一台电脑为一个访客。一天内相同的客户端只被计算
    一次。可以理解成访问某网站的电脑的数量。网站判断来访电脑的身份是通过cookies实现的。如
    果更换了IP后但不清除cookies,再访问相同网站,该网站的统计中UV数是不变的
    范例:
甲乙丙三人在同一台通过 ADSL 上网的电脑上(中间没有断网),分别访问 www.magedu.com 网站,并且
每人各浏览了2个页面,那么网站的流量统计是:
IP: 1 PV:6 UV:1
若三人都是ADSL重新拨号后,各浏览了2个页面,则
IP: 3 PV:6 UV:1
网站访问量

QPS:request per second,每秒请求数

​ QPS= PV * 页面衍生连接次数/ 统计时间(86400)
​ 并发连接数 =QPS * http平均响应时间

峰值时间:每天80%的访问集中在20%的时间里,这20%时间为峰值时间

峰值时间每秒请求数(QPS)=( 总PV数 *页面衍生连接次数)*80% ) / ( 每天秒数 * 20% )

2.5 HTTP工作机制

web资源:一个网站不是由一个资源组成的,而是多个资源的集合

资源类型

静态文件:无需服务端做出额外处理

  • 文件后缀:.html, .txt, .jpg, .js, .css, .mp3, .avi (客户端浏览器可以直接看源码)

动态文件:服务端执行程序,返回执行的结果

  • 文件后缀:.php, .jsp ,.asp (客户端浏览器看不到源码,而是服务器端的执行结果)

提高HTTP连接性能:

  • 并行连接:通过多条TCP连接发起并发的HTTP请求
  • 持久连接:keep-alive,重用TCP连接,以消除连接和关闭的时延,以事务个数和时间来决定是否关
    闭连接
  • 管道化连接:通过共享TCP连接发起并发的HTTP请求
  • 复用的连接:交替传送请求和响应报文(实验阶段)
HTTP协议版本
http/0.9

1991,原型版本,功能简陋,只有一个命令GET。GET /index.html ,服务器只能回应HTML格式字符
串,不能回应别的格式

http/1.0
  • 1996年5月,支持cache,MIME,method
  • 不支持长连接,每此链接只能发送一个请求
  • 支持POST命令和HEAD命令
  • 头信息是 ASCII 码,后面数据可为任何格式。实现了数据的分类
http/1.1
  • 1997年1月,引入了持久连接。对于同一个域名,大多数浏览器允许同时建立6个持久连接
  • 引入了管道机制,即在同一个TCP连接里,客户端可以同时发送多个请求。
  • 新增PUT、PATCH、OPTIONS、DELETE命令
  • 队头堵塞:服务器按顺序处理请求,前面的请求处理的慢,后面的只能等待
  • HTTP 协议不带有状态,每次请求都必须附上所有信息。浪费带宽

优化技巧:两种方法,一是减少请求数,二是同时多开持久连接

合并脚本和样式表、将图片嵌入CSS代码、域名分片(domain sharding)等

HTTP1.0和HTTP1.1的区别

img

  • 对header中缓存的判断不同

​ 在HTTP1.0中主要使用header里的If-Modified-Since,Expires来做为缓存判断的标准,HTTP1.1则引入了更多的缓存控制策略例如Entity tag,If-Unmodified-Since, If-Match, If-None-Match等更多可供选择的缓存头来控制缓存策略

  • http1.1相对于1.0优化了网络带宽的使用:

HTTP1.0中,存在一些浪费带宽的现象,例如:客户端只是需要某个对象的一部分,而服务器却将整个对象送过来了,并且不支持断点续传功能,HTTP1.1则在请求头引入了range头域,它允许只请求资源的某个部分,即返回码是206(Partial Content),方便了开发者自由的选择以便于充分利用带宽和连接。

  • 错误通知的不同:

在HTTP1.1中新增24个状态响应码,如409(Conflict)表示请求的资源与资源当前状态冲突;410(Gone)表示服务器上的某个资源被永久性的删除

  • 对Host头处理不同:

在HTTP1.0中认为每台服务器都绑定一个唯一的IP地址,因此,请求消息中的URL并没有传递主机名(hostname)。但随着虚拟主机技术的发展,在一台物理服务器上可以存在多个虚拟主机(Multi-homed Web Servers),并且它们共享一个IP地址。HTTP1.1的请求消息和响应消息都应支持Host头域,且请求消息中如果没有Host头域会报告一个错误(400 Bad Request)

HTTP1.0和1.1存在的问题
  • HTTP1.x在传输数据时,每次都需要重新建立连接,无疑增加了大量的延迟时间,特别是在移动端
    更为突出
  • HTTP1.x在传输数据时,所有传输的内容都是明文,客户端和服务器端都无法验证对方的身份,无
    法保证数据的安全性
  • HTTP1.x在使用时,header里携带的内容过大,增加了传输的成本,并且每次请求header基本不
    怎么变化,尤其在移动端增加用户流量
  • 虽然HTTP1.x支持了keep-alive,来弥补多次创建连接产生的延迟,但是keep-alive使用多了同样
    会给服务端带来大量的性能压力,并且对于单个文件被不断请求的服务(例如图片存放网站),
    keep-alive可能会极大的影响性能,因为它在文件被请求之后还保持了不必要的连接很长时间
HTTP2.0
  • 2015年,HTTP2.0是谷歌SPDY协议的升级版
  • 头信息和数据体都是二进制,称为头信息帧和数据帧
  • 复用TCP连接,避免了队头堵塞,在一个连接里,客户端和浏览器都可以同时发送多个请求或回应,且不用按顺序处理,此双向的实时通信称为多工(Multiplexing)
  • 引入头信息压缩机制(header compression),头信息使用gzip或compress压缩后再发送;客户
    端和服务器同时维护一张头信息表,所有字段都会存入这个表,生成一个索引号,不发送同样字
    段,只发送索引号,提高速度
  • HTTP/2 允许服务器未经请求,主动向客户端发送资源,即服务器推送(server push)
http2.0和SPDY的区别:
  • HTTP2.0 支持明文 HTTP 传输,而 SPDY 强制使用 HTTPS
  • HTTP2.0 消息头的压缩算法采用 HPACK,而非 SPDY 采用的 DEFLATE

2.6 http请求完整的访问流程

img

2.6.1 建立连接

接收或拒绝连接请求

2.6.2 接收请求

接收客户端请求报文中对某资源的一次请求的过程

img

  • 单进程I/O模型:启动一个进程处理用户请求,而且一次只处理一个,多个请求被串行响应
  • 多进程I/O模型:并行启动多个进程,每个进程响应一个连接请求
  • 复用I/O结构:启动一个进程,同时响应N个连接请求
  • 复用的多进程I/O模型:启动M个进程,每个进程响应N个连接请求,同时接收M*N个请求
2.6.3 处理请求

​ 服务器对请求报文进行解析,并获取请求的资源及请求方法等相关信息,根据方法,资源,首部和可选的主体部分对请求进行处理

常用请求Method: GET、POST、HEAD、PUT、DELETE、TRACE、OPTIONS

2.6.4 访问资源

服务器获取请求报文中请求的资源web服务器,即存放了web资源的服务器,负责向请求者提供对方
请求的静态资源,或动态运行后生成的资源

2.6.5 构建响应报文

一旦Web服务器识别除了资源,就执行请求方法中描述的动作,并返回响应报文。响应报文中 包含
有响应状态码、响应首部,如果生成了响应主体的话,还包括响应主体

2.6.6 发送响应报文

非持久连接:服务器应该在发送了整条报文之后,关闭自己这一端的连接

持久连接:连接可能仍保持打开状态,在这种情况下,服务器要正确地计算Content-Length首部

2.6.7 记录日志

最后,当事务结束时,Web服务器会在日志文件中添加一个条目,来描述已执行的事务


请求的静态资源,或动态运行后生成的资源

2.6.5 构建响应报文

一旦Web服务器识别除了资源,就执行请求方法中描述的动作,并返回响应报文。响应报文中 包含
有响应状态码、响应首部,如果生成了响应主体的话,还包括响应主体

2.6.6 发送响应报文

非持久连接:服务器应该在发送了整条报文之后,关闭自己这一端的连接

持久连接:连接可能仍保持打开状态,在这种情况下,服务器要正确地计算Content-Length首部

2.6.7 记录日志

最后,当事务结束时,Web服务器会在日志文件中添加一个条目,来描述已执行的事务

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值