用户访问网站原理
- 进行DNS域名解析过程
本地解析 递归解析 迭代解析 - 建立TCP三次握手过程
- 传递HTTP请求数据包
- 传递HTTP响应数据包
- 利用浏览器解析收到HTTP数据包内容,显示网站页面信息
HTTP协议报文结构说明
- HTTP请求报文结构
- 请求行信息
GET / HTTP/1.1
GET:请求网站方式
/:请求网站数据信息 可以具体指定请求数据信息
HTTP/1.1:请求协议版本(HTTP1.1 HTTP1.2 HTTP2.0)
HTTP1.0:利用tcp协议短连接通讯方式
HTTP1.1:利用tcp协议长连接通讯方式
HTTP2.0:提升并发访问效率
- 请求头信息
User-Agent: curl/7.29.0
Host: www.baidu.com
Accept:*/*
User-Agent:显示访问网站客户端浏览软件信息
Host:访问网站主机信息 申请获得二级域名 - 空行
- 请求主体信息
当前查看网站信息时,请求主体信息是空的 GET
当前提交网站信息时,请求主体会有具体信息 POST
- HTTP响应报文结构
- 起始行信息 响应行部分
HTTP/1.1 200 ok
HTTP/1.1:HTTP协议版本信息
200:相应状态码信息
ok:对状态码进行简单描述
- 响应头信息
Accept-Ranges: bytes
Cache-Control: private, no-cache, no-store, proxy-revalidate, no-transform
Connection: keep-alive — HTTP连接方式:长连接方式
Content-Length: 2381 — 网站页面字节长度信息(消耗流量)
Content-Type: text/html — 相应数据类型 文本/html
Date: Wed, 05 Feb 2020 02:25:11 GMT
Etag: “588604c8-94d”
Last-Modified: Mon, 23 Jan 2017 13:27:36 GMT
Pragma: no-cache
Server: bfe/1.0.8.18 — 识别服务端网站服务信息
Set-Cookie: BDORZ=27315; max-age=86400; domain=.baidu.com; path=/ - 空行
- 响应主体信息
响应回来的网站页面代码信息,被浏览器可以解析
HTML代码信息:构建网站页面代码 标签语法结构
CSS代码信息:制定页面显示样式信息
js代码信息:制定显示特殊效果
用户访问网站资源介绍
名词概念
URL:统一资源定位符
URI:统一资源标识符
①
①表示访问网站协议信息
- HTTP:超文本传输协议 80端口
- HTTPS:安全超文本传输协议 443端口
②网站域名信息 URL
③网站资源信息 首页文件 index.html uri信息
静态网站资源
-
根据访问资源类型URI信息类型
-
根据网站维护特点
-
便于被搜索引擎收录
-
没有数据库服务支持
-
和网站交互能力丧失
-
访问浏览效率较高,所有操作都是由浏览器进行解析识别
动态网站资源
- 根据访问资源类型URI信息类型
- 根据网站维护特点
- 有数据库支持,交互能力强
- 不便于被搜索引擎收录
- 动态资源网站访问效率较低
网站访问流量度量方式
- IP:根据用户IP源地址(公网),统计网站用户访问量
- PV:根据网站页面浏览数量是否合理
- UV:记录独立访客数量
cookie:小型文本文件,是某些网站为了辨别用户身份,进行Session跟踪而储存在用户本地终端上的数据(通常经过加密),由用户客户端计算机暂时或永久保存的信息
session:会话控制,Session对象存储特定用户会话所需的属性及配置信息
参考资源:
(http://alexa.chinaz.com/alexa_more.aspx)