Web基础与HTTP协议

原创已于 2022-05-19 16:25:36 修改 · 362 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#前端 #http #网络

于 2022-05-17 15:44:00 首次发布

文章目录

前言
DNS 与域名
域名概述
- 域名的概念
- 早期使用 Hosts 文件解析域名
- DNS（Domain Name System 域名系统）
- 域名空间结构
域名注册
网页（HTTP/HTTPS）
- 网页
- 网站
- 主页
- 域名
- HTTP/HTTPS
- URL
- HTML
- 超链接
- 发布
HTML概述
- HTML超文本标记语言
- HTML文档的结构
网页基本标签
- 网页摘要信息的作用
Web概述
Web 1.0 与 Web 2.0
- Web 1.0
- Web 2.0
静态网页
动态网页
动态网页的特点
- 交互性
- 自动更新
小结
HTTP协议概述
- HTTP 是一种无状态（stateless）协议
- HTTP协议是互联网上应用最为广泛的一种网络协议，设计这个协议的目的是为了发布和接受 Web 服务器上的 HTML 页面
- HTTP协议的版本
HTTP 请求格式（ GET / POST 方式）
- GET 方式
- POST请求方式
- GET 与 POST 区别
- 简单的理解：
HTTP状态码
生产环境常见的 HTTP 状态码
总结

前言

介绍 Web 基础知识，包括域名的概念、 DNS 原理、静态网页和动态网页的相关知识。

DNS 与域名

网络是基于 TCP/IP 协议进行通信和连续的，每一台主机都有一个唯一的标识（固定的 IP 地址），用以区别在网络上成千上万个用户和计算机。网络在区分所有与之相连的网络和主机时，均采用一种唯一、通信的地址格式，即每一个与网络相连接的计算机和服务器都被指派一个独一无二的地址

七层参考模型和五层，逻辑网卡和物理网卡 bond

为了保证网络上每台计算机的 IP 地址的唯一性，用户必须向特定机构申请注册，分配 IP 地址网络中的地址方案分为两套：IP 地址系统和域名地址系统。这两套地址系统其实是一一对应的关系由于 IP 地址是数学标识，使用时难以记忆和书写，因此在 IP 地址的基础上又发展出一种符号的地址方案，来代替数字型的 IP 地址。

域名概述

域名的概念

IP地址不易记忆

早期使用 Hosts 文件解析域名

主机名称重复
主机维护困难

DNS（Domain Name System 域名系统）

分布式
层次性

在这里插入图片描述

域名空间结构

根域
顶级域
- 组织域
- 国家/地区域名
二级域名
FQDN=主机名.DNS后缀

在这里插入图片描述

域名注册

域名注册是 Internet 中用于解决地址对应问题的一种方法
遵循先申请先注册原则
域名注册步骤

在这里插入图片描述

网页（HTTP/HTTPS）

网页

纯文本格式文件
编辑语言为HTML
在用户的浏览器中被“ 翻译 ”成网页形式显示出来。

网站

由一个一个页面构成的，是多个网页的结合体。

主页

打开网站后出现的第一个网页称为网站主页（或首页）

域名

浏览网页时输入的网址

HTTP/HTTPS

用来传输网页的通信协议（是否加密），是一种通讯/交互的标准/规范

URL

是一种万维网寻址系统

HTML

用来编写网页的超文本标记语言

超链接

超链接是将网站中不同网页链接起来的功能

发布

将制作好的网页上传到服务器提供用户访问的过程

HTML概述

HTML超文本标记语言

Hyper Text Markup Language
网页的“源码”
浏览器：“解释和执行”HTML源码的工具

HTML文档的结构

HTML网页
- 头部部分
- 标题部分
- 主体部分
- 网页内容，包括文本、图像等。

网页基本标签

标题标签
行控制相关标签
范围标签
图像标签
超链接标签
特殊符号

网页摘要信息的作用

有利于浏览器解析
有利于搜索引擎搜索
< title > 标签 ——标题
< meta > 标签 ——元标志

Web概述

Web（World Wide Web）即全球广域网，也称为万维网
一种分布式图形信息系统
建立在Internet上的一种网络服务

Web 1.0 与 Web 2.0

Web 1.0

以编辑为特征，网站提供给用户的内容是编辑处理后的，然后用户阅读网站提供的内容。
过程是网站到用户的单向行为。

Web 2.0

更注重用户的交互作用，用户既是网站内容的消费者（浏览者），也是网站内容的制造者。
加强了网站与用户之间的互动，网站内容基于用户提供，网站的诸多功能也由用户参与建设，实现了网站与用户双向的交流与参与。
Web 2.0 特征
- 用户分享、以兴趣为聚合点的社群、开房的平台，活跃的用户
Web 1.0 为以读为主的；意思是静态；静态为只可查看，不可交互；
Web 2.0 为动态；动态可进行用户交互。

静态网页

静态网页是标准的HTML文件
扩展名是.htm、.html
- 文本、图像、声音、Flash动画、客户端脚本和ActiveX控件及Java小程序等。
网站建设的基础，早期网站一般都由静态网页制作
没有后台数据库、不含程序和不可交互的网页
相对更新起来比较麻烦，适用于一般更新较少的展示型网站
每个静态网页都有一个固定的URL，且URL以" .htm “、” .html “、” .shtml "等常见形式为后缀，而不含有“ ？ ”
网页内容一经发布到网站服务器上，无论是否有用户访问，每个静态网页都是不保存在网站服务器上的
静态网页的内容相对稳定，容易被搜索引擎检索
静态网页网页没有数据库的支持，在网站制作和维护方面工作量较大，因此当网站信息量很大时完全依靠静态网页制作方式比较困难
静态网页的交互性较差，在功能方面有较大的限制
页面浏览速度迅速，过程无需连接数据库，开启页面速度快于动态页面

动态网页

网页 URL 不固定，能通过后台与用户交互
在动态网页网址中有一个标志性的符号——“ ？ ”
常用的语言有 PHP、JSP、Python、Ruby等

在这里插入图片描述

动态网页的特点

交互性

网页会根据用户的要求和选择而动态改变和响应，将浏览器作为客户端界面，今后Web发展的大势所趋

自动更新

无须手动地更新 HTML 文档，便会自动生成新的页面

小结

DNS服务器的作用
HTML文档的结构
Web 1.0 与 Web 2.0区别
动态页面与静态页面区别
静态页面在功能上有很多限制

HTTP协议概述

HTTP（超文本传输协议HyperText Transfer Protocol）协议是互联网上应用最为广泛的一种网络协议，它是基于 TCP 协议的应用层传输协议，简单来说就是客户端和服务端进行数据传输的一种规则。

HTTP/HTTPS是应用层上的协议，建立在传输层 TCP 之上，客户端通过通过与服务端进行 TCP 连接（三次握手），之后发送 HTTP 请求与接受 HTTP 响应都是通过访问 Socket 接口来调用 TCP 协议实现。

HTTP 是一种无状态（stateless）协议

HTTP 协议本身不会对发送过的请求和相应的通信状态进行持久化处理（存储，保存）。这样做的目的是为了保持 HTTP 协议的简单性，从而能够快速处理大量的事务，提高效率。

然而，在许多应用场景中，需要保持用户登录的状态或记录用户购物车的商品。由于 HTTP 是无状态协议，所以必须引入一些技术来记录管理状态，例：Cookie。

cookie 和 session 都为J买现的是 http 的短期的持久化（内存/缓存万式，查面快、效率比牧高） cookie 是缓存在用户端（ cliont ）浏览器中的（默认缓存一天），当下次客户端通过同一个浏览器访问客户端的时候，会优先读取 cookie 中的缓存信息，向服务端进行请求，同时服务端收到客户端请求的时候，读取到 cookie 文件，知道客户端之前找的是服务器A处理的任务，为了省事儿，省资源，干脆直接讲请求直接再交给服务器A处理。

cookie 和 session 的对比
cookie 省服务器性能
session 更安全

为后面服务、集群、功能优化做铺垫；
具体解释了怎么解决 HTTP 无状态协议的持久化/存储。

客户端建立在服务端的时候会使用Socket

HTTP协议是互联网上应用最为广泛的一种网络协议，设计这个协议的目的是为了发布和接受 Web 服务器上的 HTML 页面

HTTP协议的版本

HTTP 0.9（已过时）
HTTP 1.0（完善的请求、响应模型  并且协议补充（完整） get  post head方法）
HTTP 1.1（新增五种请求方式：OPTIONS  PUT  DELETE  TRACE  CONNECT）
HTTP 2.0

HTTP 请求格式（ GET / POST 方式）

GET 方式

请求行
请求的方式
请求的资源路径
请求的版本协议号
请求头（描述信息/标准化信息）
Accept：客户端可以接受的数据类型
Accept-Language：客户端可以接受的语言类型
User-Agent：浏览器的信息
Accpect-Encoding：客户端可以接受的编码格式
Host：表示请求的 ip 和端口号
Connection：告诉服务器请求连接如何处理
Keep-Alive：通知服务器回传数据不要马上关闭，保持一小段的连接
Closed：马上关闭

POST请求方式

请求行
请求的方式
请求的资源路径
请求的协议的版本号
请求头
Accept：客户端可以接受的数据类型

Accept-Language：客户端可以接受的语言类型

Referer：表示请求发起时，浏览器地址栏中的地址

User-Agent：浏览器的信息

Content-Type：发送的数据类型

Content-Length：发送的数据长度
请求体
就是发送给服务器的数据

GET 与 POST 区别

区别一：语义上的区别
Get 向服务器请求数据，依照 HPPT 协议，get 是用来请求数据。
Post 向服务器发数据，依照 HTTP 协议，Post的语义是向服务器添加数据，也就是说按照 Post 的语义，该操作是会修改服务器上的数据
区别二：服务器请求的区别
Get 请求是可以被缓存，例：
访问百度，访问的方式就是 GET ，此时访问后的内容会被缓存在浏览器中，短时间再次访问，其实是拿到的浏览器中的缓存内容
另外 Get 请求只能接受 ASCII 码的回复。

Post 请求是不可以被缓存的。对于 Post 方式提交表单，刷新页面浏览器会弹出提示框“是否重新提交表单”，Post 可以接收二进制等各种数据形式，所以如果要上传文件一般用 Post 请求。
区别三：参数放请求头和请求体的差别

Get 请求通常没有请求体（当然这也是可以由程序猿心情改变的），在 TCP 传输中只需传输一次（而不是一个包），所以 Get 请求效率相对高。

Post 请求将数据放在请求体中，而实际传输中，会先传输完请求头，再传输请求体，是分为两次传输的（而不是两个包）。Post 请求头会比 Get 更小（一般不带参数），请求头更容易在一个 Tcp 包中完成传输，更何况请求头中有 Content-Length 的标识，
可以更好地保证 Http 包的完整性。

简单的理解：

GET方法：
从指定的服务器上获得数据
GET请求能被缓存
GET请求会保存在浏览器的浏览纪录里（cookit）
GET请求有长度的限制
主要用于获取数据
查询的字符串会显示在URL中，不安全

POST方法：
提交数据给指定服务器处理
POST请求不能被缓存
POST请求不会保存在浏览器的浏览纪录里
POST请求没有长度限制
查询的字符串不会显示在URL中，比较安全

HTTP状态码

当使用浏览器访问某一个 URL ，会根据处理情况返回相应的处理状态
通常正常的状态码为2xx，3xx（如200）
如果出现异常会返回4xx，5xx（如404）

状态码首位	已定义范围	分类
1xx	100~101	信息提示
2xx	200~206	成功
3xx	300~305	重定向
4xx	400~415	客户端错误
5xx	500~505	服务器错误

生产环境常见的 HTTP 状态码

消息	描述
200	OK	请求成功（其后是对 GET 和 POST 请求的应答文档）
301	Moved Permanently	请求的永久页面跳转
403	Forbidden	禁止访问该页面
404	Not Found	服务器无法找到被请求的页面
500	Internal Server Error	内部服务器错误
502	Bad Gateway	无效网关
503	Service Unavailable	当前服务不可用
504	Gateway Timeout	网关请求超时