Web基础与HTTP协议

本文详细介绍了DNS解析的三个关键文件:/etc/hosts、/etc/resolv.conf和网卡配置文件,以及域名与IP地址的关系。接着,深入讲解了网页的基本概念,包括HTML、静态和动态页面的区别,以及GET和POST请求的区别。此外,还阐述了HTTP协议的重要特性,如状态码和请求流程。通过对Web1.0和Web2.0的对比,展示了互联网的发展历程。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、DNS与域名

1、网络是基于 TCP/IP 协议进行通信和连接的,每一台主机都有一个唯一的标识(固定的 IP 地址),用以区别在网络上成千上万个用户和计算机。网络在区分所有与之相 连的网络和主机时,均采用一种唯一、通用的地址格式,即每一个与网络相连接的计算机和服务器都被指派一个独一无二的地址

七层参考模型和五层,逻辑网卡和物理网卡bond

2、为了保证网络上每台计算机的 IP 地址的唯 一性,用户必须向特定机构申请注册,分配 IP 地址网络中的地址方案分为两套:IP 地址系统 和 域名地址系统。这两套地址系统其实是一一对应的关系,由于 IP 地址是数字标识,使用时难以记忆和书写,因此在IP 地址的基础上又发展出一种符号化的地址方案,来代替数字型的 IP 地址

总结:
(1)网络上交互是基于TCP/IP协议的,每个主机在逻辑上有一个唯一位置标识(IP地址),物理地址为MAC地址
(2)为了保证地址唯一性,用户协议向特地给机构申请注册,分配IP地址网络中的地址有两套方案:
① IP地址系统
② 域名地址系统
而由于IP是由32位二进制数字标识,不方便记忆,所以 以IP地址为基础发展出了符号化地址来代替解决方案,也是是域名

提问:阿里云域名怎么申请
申请查询重名给钱20-60块备案(阿里云〉拍照(负责人拍照人)10-20天申请之后就可以解析和用但是如果有问题会被封

二、DNS解析

2.1 /etc/hosts

linux系统中负责快速解析的文件,包含了ip与主机名的映射关系,在没有DNS服务器的情况下,使用本地/etc/hosts完成解析/映射,实现快速访问

主要用于主机之间(IP和主机名)的映射/解析关系
192.168.226.128 master
192.168.226.129 node1
192.168.226.130 node2

2.2 /etc/resolv.conf

DNS客户端配置文件,主要用于设置DNS服务器的IP和域名,还包含了主机域名的搜索顺序等等,这个文件是由域名解析器(resolver,一个根据主机名解析IP地址的库)使用的配置文件。

主要用与匹配DNS服务器
nameserver 114.114.114.114
nameserver 8.8.8.8
nameserver 218.2.135.1

2.3 网卡配置文件

/etc/sysconfig/network-scripts/ifcfg-ens33

我们也可以在网卡配置文件中定义DNS1= DNS2=

生效顺序 1 hosts文件 2 网卡配置文件 3 /etc/resolv.conf

三、域名

链接: link

四、网页

4.1、网页基本概念

(1)网页
①纯文本格式文件

②编写语言为HTML

③在用户的浏览器中被“翻译”成网页形式显示出来

(2)网站
①由一个一个页面构成的,是多个网页的结合体

②主页,打开网站后出现的第一个网页称为网站主页(或首页)

(3)域名
浏览网页时输入的网址

(4)HTTP/HTTPS
用来传输网页的通信协议(是否加密),是一种通讯/交互的标准/规范

(5)URL
是一种万维网寻址系统

(6)HTML
用来编写网页的超文本标记语言

(7)超链接
超链接是将网站中不同网页链接起来的功能

(8)发布
将制作好的网页上传到服务器供用户访问的过程

4.2 HTML

4.2.1、HTML超文本标记语言

Hyper Text Markup Language
网页的“源码”
浏览器:“解释和执行”HTML源码的工具

4.2.2、HTML文档的结构

HTML网页
头部部分
标题部分
主体部分
网页内容,包括文本、图像等

例:

<html>
<head>
<title>diyige</title>
</head>
<body >
       狗拆到此一游!
</body>
</html>

在这里插入图片描述
如果出现httpd已经安装,但是/var/www/html网页打不开
尝试:

1 . 临时关闭selinuxsetenforce 0,
永久关闭selinux
vi /etc/sysconfig/selinux
把里边的一行改为
SELINUX=disabled
改了之后保存,然后重启就可以了。
以上无效的话
尝试下种方法:

2.
输入命令 
`iptables -L`
将查询到的全部干掉,
`iptables -F` ,
重启httpd
systemctl restart httpd
再打开网页,显示正常
头标签中常用标签:
标签				描述
<title>				定义了文档的标题
<base>				定义了页面链接标签的默认链接地址
<link>				定义了一个文档和外部资源之间的关系
<meta>				定义了 HTML 文档中的元数据
<script>			定义了客户端的脚本文件
<style>				定义了 HTML 文档的样式文件

内容标签中常用标签
标签				描述
<table>				定义一个表格
<tr>				定义了表格中的一行
<td>				定义了表格中某一行的一列
<img>				定义了一个图像
<a>					定义了一个超链接
<p>					定义了一行
<br>				定义了换行
<font>				定义了字体
4.2.3、网页基本标签

网页摘要信息的作用

有利于浏览器解析
有利于搜索引擎搜索

<title>标签		#标题
<meta>标签		#元标志
4.2.4、标题标签类型

行控制相关标签
范围标签
图像标签
超链接标签
特殊符号

五、Web

5.1 Web概述

Web(World Wide Web)即全球广域网,也称为万维网。
一种分布式图形信息系统,建立在Internet上的一种网络服务

5.2 Web1.0 vs Web2.0

Web1.0
以编辑为特征,网站提供给用户的内容是编辑处理后的,然后用户阅读网站提供的内容这个过程是网站到用户的单向行为

Web2.0
更注重用户的交互作用,用户既是网站内容的消费者(浏览者),也是网站内容的制造者加强了网站与用户之间的互动,网站内容基于用户提供,网站的诸多功能也由用户参与建设,实现了网站与用户双向的交流与参与

Web2.0特征
用户分享、以兴趣为聚合点的社群、开放的平台,活跃的用户

5.3 静态页面

5.3.1静态页面定义

①静态网页是标准的HTML文件

②扩展名是.htm、.html
例如文本、图像、声音、Flash动画、客户端脚本和ActiveX控件及Java小程序等

③是网站建设的基础,早期网站一般都由静态网页制作

④没有后台数据库、不含程序和不可交互的网页

⑤相对更新起来比较麻烦,适用于一般更新较少的展示型网站

5.3.2、静态页面特点:

①每个静态网页都有一个固定的URL,且URL以.htm、.html、.shtml等常见形式为后缀,而不含有“?”
②网页内容一经发布到网站服务器上,无论是否有用户访问,每个静态网页都是保存在网站服务器上的
③静态网页的内容相对稳定,容易被搜索引擎检索
④静态网页没有数据库的支持,在网站制作和维护方面工作量较大,因此当网站信息量很大时完全依靠静态网页制作方式比较困难
⑤静态网页的交互性较差,在功能方面有较大的限制
⑥页面浏览速度迅速,过程无需连接数据库,开启页面速度快于动态页面

5.4 动态页面

①网页 URL不固定,能通过后台与用户交互
②在动态网页网址中有一个标志性的符号——“?”
③常用的语言有PHP、JSP、Python、Ruby等

5.4.1、动态页面特点

①交互性
网页会根据用户的要求和选择而动态改变和响应,将浏览器作为客户端界面,这将是今后WEB发展的大势所趋
②自动更新
无须手动地更新HTML文档,便会自动生成新的页面,可以大大节省工作量
③因时因人而变
当不同的时间,不同的人访问同一网址时会产生不同的页面

六、HTTP协议

6.1、http协议概述

HTTP(超文本传输协议HyperText Transfer Protocol)协议是互联网上应用最为广泛的一种网络协议,它是基于TCP协议的应用层传输协议,简单来说就是客户端和服务端进行数据传输的一种规则。

TTP/HTTPS是应用层上的协议,建立在传输层TCP之上,客户端通过与服务端进行TCP连接(三次握手),之后发送HTTP请求与接收HTTP响应都是通过访问Socket接口来调用TCP协议实现。

HTTP 是一种无状态 (stateless) 协议, HTTP协议本身不会对发送过的请求和相应的通信状态进行持久化处理(存储,保存)。这样做的目的是为了保持HTTP协议的简单性,从而能够快速处理大量的事务, 提高效率。

然而,在许多应用场景中,我们需要保持用户登录的状态或记录用户购物车中的商品。由于HTTP是无状态协议,所以必须引入一些技术来记录管理状态,例如Cookie。

cookie和session都为了实现的是http的短期的持久化(内存/缓存方式,查询快、效率比较高)cookie
是缓存在用户端(client)浏览器中的(默认缓存一天),当下次客户端通过同一个浏览器访问客户端的时候,会优先读取cookie中的缓存信息,向服务端进行请求,同时服务端收到客户端请求的时候,读取到cookie文件,知道客户端之前找的是服务器A处理的任务,为了省事儿,省资源,干脆直接讲请求直接再交给服务器A处理
两者对比:
cookie 省服务器性能
session 更安全
1、为后面服务、集群、功能优化做铺垫
2、具体解释了怎么解决HTTP无状态协议的持久化/存储。

6.2 HTTP协议的版本

HTTP 0.9:已过时

HTTP 1.0 完善的请求、响应模型并且协议补充(完整) get 、post 、head方法

HTTP 1.1 现在1.0基础上进行更新,新增五种请求方式: OPTIONS PUT DELETE TRACE CONNECT

HTTP 2.0

6.2.1、HTTP1.0和HTTP1.1之间的区别

缓存处理
带宽优化及网络连接的使用
错误通知的管理
Host头处理
长连接

6.3 HTTP 请求格式( GET / POST 方式 )

6.3.1 GET 方式

①请求行
请求的方式
请求的资源路径
请求的版本协议号

②请求头(描述信息/标准化信息)
Accept:客户端可以接受的数据类型
Accept-Language:客户端可以接受的语言类型
User-Agent:浏览器的信息
Accpect-Encoding:客户端可以接受的编码格式
Host:表示请求的ip和端口号
Connection:告诉服务器请求连接如何处理
Keep-Alive:通知服务器回传数据不要马上关闭,保持一小段的连接
Closed:马上关闭

6.3.2 POST 请求方式

①请求行
请求的方式
请求的资源路径
请求的协议的版本号

②请求头

Accept:客户端可以接受的数据类型
Accept-Language:客户端可以接受的语言类型
Referer:表示请求发起时,浏览器地址栏中的地址
User-Agent:浏览器的信息
Content-Type:发送的数据类型
Content-Length:发送的数据长度

③请求体:就是发送给服务器的数据

6.3.3 GET 与 POST 区别

区别一 : 语义上的区别

Get向服务器请求数据,依照HTTP协议,get 是用来请求数据。
Post向服务器发数据,依照HTTP协议,Post的语义是向服务器添加数据,也就是说按照Post的语义,该操作是会修改服务器上的数据

区别二 :服务器请求的区别
Get请求是可以被缓存,示例:
访问百度,访问的方式就是GET,此时访问后的内容会缓被存在浏览器中,短时间再次访问,其实是拿到的浏览器中的缓存内容另外Get请求只能接收ASCII码的回复
Post请求是不可以被缓存的。对于Post方式提交表单,刷新页面浏览器会弹出提示框“是否重新提交表单”,Post可以接收二进制等各种数据形式,所以如果要上传文件一般用Post请求

区别三 : 参数放请求头和请求体的差别
Get请求通常没有请求体(当然这也是可以由程序猿心情改变的),在TCP传输中只需传输一次(而不是一个包),所以Get请求效率相对高。
Post请求将数据放在请求体中,而实际传输中,会先传输完请求头,再传输请求体,是分为两次传输的(而不是两个包)。
Post请求头会比Get更小(一般不带参数),请求头更容易在一个TCP包中完成传输,更何况请求头中有Content-Length的标识,可以更好地保证Http包的完整性。

简单的理解:

GET方法:
从指定的服务器上获得数据
GET请求能被缓存
GET请求会保存在浏览器的浏览纪录里(cookit)
GET请求有长度的限制
主要用于获取数据
查询的字符串会显示在URL中,不安全

POST方法:
提交数据给指定服务器处理
POST请求不能被缓存
POST请求不会保存在浏览器的浏览纪录里
POST请求没有长度限制
查询的字符串不会显示在URL中,比较安全

6.4 HTTP状态码

当使用浏览器访问某一个URL,会根据处理情况返回相应的处理状态

通常正常的状态码为2xx,3xx(如200)

如果出现异常会返回4xx,5xx(如404)

状态码首位已定义范围分类
1xx100 - 101信息提示
2xx200 - 206成功
3xx300 - 305重定向
4xx400 - 415客户端错误
5xx500 - 505服务器错误

生产环境常见的HTTP状态码

消息描述意义
200OK请求成功(其后是对GET和POST请求的应答文档)
301Moved Permanently请求的永久页面跳转
403Forbidden禁止访问该页面
404Not Found服务器无法找到被请求的页面
500Internal Server Error内部服务器错误
502Bad Gateway无效网关
503Service Unavailable当前服务不可用
504Gateway Timeout网关请求超时

6.5 HTTP协议请求流程分析

(1)http协议请求流程分析低配版

用户输入URL(地址链接)
客户端获取到端口及主机名后,客户端利用DNS解析域名,首先客户端的浏览器会先找自身的缓存,如果有解析结束,如果没有,客户端会去找host文件,如果host文件没有的话,客户端会去找本地的DNS缓存服务器,本地的DNS缓存服务器没有的话,缓存服务器会去找根域,根域没有,会返回一个.com.然后本地缓存服务器会去找顶级域,顶级域没有的话会返回baidu.com.,然后本地缓存服务器会去找二级域,二级域解析完后会返回客户端。
客户端解析到IP地址后会通过TCP的三次握手与服务器建立连接

(2)http协议请求流程分析详细版

用户输入URL(地址链接)(http://www.baidu.com:80/tools.html)客户端获取到端口及主机名后,客户端利用DNS解析域名,首先客户端的浏览器会先找自身的缓存,如果有解析结束,如果没有客户端会去找host文件,如果host文件没有的话,客户端会去找本地的DNS缓存服务器,本地的DNS缓存服务器没有的话,缓存服务器会去找根域,根域没有,会返回一个.com.然后本地缓存服务器会去找顶级域,顶级域没有的话会返回baidu.com.,然后本地缓存服务器会去找二级域,二级域解析完后会返回客户端。

客户端解析到IP地址后会通过TCP的三次握手与服务器建立连接,首先客户端向服务器发送请求连接报文,SYN=1初始序号seq为x,这时客户端进入SYN-SENT状态,服务器确认请求报文ACK=1,SYN=1,确认序号ACK=X+1,服务器产生的初始序号seq=y,回复客户端确认连接,此时服务器进入SYN-RCVD状态,客户端接受后确认报文ACK=1,ACK=y+1,客户端又重组序号为x+1。TCP连接已经建立,客户端进入ESTABLISHED 状态,当服务器收到客户端的确认后,也会进入 ESTABLISHED 状态。客户端连接到IP地址,发送httpGET的请求,从服务器读取http响应。

之后断开连接时,需要通过TCP的四次挥手完成,客户端向服务器发送断开连接请求报文,FIN=1,ACK=1,序号为u,客户端处于FIN—WAIT-1(终止等待1)状态,服务器确认报文ACK=1,确认序号为ACK=u+1,服务器的序号为v,回复客户端,服务器服务端处于CLOSE—WAIT(关闭等待)状态,客户端接受确认报文ACK=1,确认序号ACK=v+1,客户端重组序号为seq=u+1,客户端处于FIN—WAIT-2(终止等待2)状态,然后服务器也想让客户端断开连接,就发送了断开连接请求,FIN=1,ACK=1,服务器重组序号为w,服务器服务端处于LAST—ACK(最后确认)状态,客户端接受后确认报文ACK=1.确认序号为ACK=w+1,客户端序号为u+1,客户端进入CLOSED(时间等待)状态,等待最长报文段寿命2*MSL,服务器确认后,立即进入关闭状态。然后进行关闭连接。

大牛的一次完整的http请求过程
链接: link

总结

1、DNS服务器作用
2、HTML文档的结构
3、Web1.0 与Web2.0区别
4、域名空间结构
5、网页基本标签
6、动态页面与静态页面区别
7、Post与Get方法区别
8、HTIP协议报文格式

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值