访问www.baidu.com全过程

本文详细介绍了网页访问的完整过程。首先是域名解析成IP,浏览器会先查询自身DNS缓存,若未找到则向DNS服务器请求。接着与目的主机进行TCP连接,即三次握手。之后发送和接收数据,包含HTTP请求和响应。最后是断开TCP连接,需四次挥手,并解释了原因。

1.域名解析成IP

每个主机在网络中都是IP为标识的,IP才是主机在网络中的位置,域名只是为了方便用户记忆而已,这就要求浏览器能够识别域名并且将其转化为对应的IP地址。

所以浏览器会有一个DNS缓存,其中记录了一些域名与IP的对应关系,供浏览器快速查找需要的IP。但是这个DNS缓存不可能存下所有的域名-IP地址,何况IP地址有时候还会变化,因此当在浏览器DNS缓存中没有找到的时候,就要先向DNS服务器请求域名解析,DNS域名解析时用的是UDP协议。

①客户端从浏览器中输入www.baidu.com网站网址后回车,首先浏览器会查询浏览器本身的DNS缓存,一般只有几分钟的缓存,找到了就返回域名对应的IP;如果找不到,系统就会查询本地hosts文件和本地DNS缓存信息,如果找到了,就返回域名对应IP;

②如果没有找到对应的域名解析记录,那么那么系统会把浏览器的解析请求,交给客户端本地设置的DNS服务器地址解析(称为Local DNS,LDNS),如果LDNS服务的本地缓存有对应的解析记录,就会直接返回IP地址;

③如果没有,LDNS会负责继续请求其他DNS服务器;此时就是外网的DNS服务器了,先是根域名服务器,根据浏览器得到的域名,根域名服务器看到.com,会返回.com的顶级域名服务器的ip给LDNS;然后LDNS通过顶级域名服务器的ip,找到了顶级域名服务器,.com顶级域名服务器看到了是找baidu.com一级域名服务器,就将其服务器的ip返回给LDNS;然后一层一层往下找,直到找到了www.baidu.com的DNS记录,并得到对应的IP地址,这时候LDNS会把找到的www.baidu.com的ip发送给客户端浏览器,并记录在缓存中,以便未来再次访问。

④客户端浏览器收到ip之后,就可以通过ip地址找到对应的web服务器了,即服务端主机;接下来就是三次握手建立连接了

2.与目的主机进行TCP连接(三次握手)

得到域名对应的ip地址后,也就表示可以将数据送达到目的主机了,即可以向服务器发送http请求了,但是http是应用层协议,tcp是传输层,所以发送http请求之前,开始我们常说的三次握手。Http请求是使用TCP进行传输的,可以保证可靠传输,并且有序,需要建立连接,才能进行数据传输。

①向目的主机发送TCP连接请求报文

②该TCP报文中SYN标志位为1,产生一个随机数j,表示连接请求

③该TCP报文通过获取的ip(DNS)找到服务器主机,然后获得MAC地址(ARP),通过网关,最终到达目的主机。

④目的主机收到数据帧后,通过ip协议传输帧,再到TCP协议,封装成请求应答报文;

⑤该报文中SYN标志为1,产生一个随机数k,ack标志位j+1,表示连接请求应答

⑥该请求应答报文通过接收到的源ip-》Mac(arp)-》网关,发送到我的主机;

⑦我的主机收到数据帧,通过ip协议传输帧,再到TCP协议,封装成请求确认报文

⑧该请求确认报文通过目标ip-》Mac(arp)-》网关,发送到目的主机

⑨请求确认报文的ack为k +1,表示请求确认;

⑩目的主机接收到数据帧,连接建立完成

3.发送和接收数据

建立连接之后,就可以发送数据了,即发送http请求

以get方法为例:

①浏览器向服务器发送get方法报文

②该get方法报文通过tcp-》ip-》mac-》网关-》目的主机

③目的主机收到数据帧,通过ip-tcp-http,http协议单元回应http协议格式封装好的HTML形式数据;

④该HTML数据通过tcp-》ip-》mac-》网关-》我的主机

⑤我的主机收到数据帧,通过ip-tcp-http-浏览器,以网页形式显式HTML

3.1http请求头详解

Post请求是可以有请求体的,而get请求不能有请求体

格式
请求首行
请求头信息
空行
请求体


GET请求

GET /hello/index.jsp HTTP/1.1

Host: localhost

User-Agent: Mozilla/5.0 (Windows NT 5.1; rv:5.0) Gecko/20100101 Firefox/5.0

Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8

Accept-Language: zh-cn,zh;q=0.5

Accept-Encoding: gzip, deflate

Accept-Charset: GB2312,utf-8;q=0.7,*;q=0.7

Connection: keep-alive

Cookie: JSESSIONID=369766FDF6220F7803433C0B2DE36D98

-------------此处是空行------------,get没有请求体

Post请求

POST /hello/index.jsp HTTP/1.1

Accept: image/gif, image/jpeg, image/pjpeg, image/pjpeg, application/msword, application/vnd.ms-excel, application/vnd.ms-powerpoint, application/x-ms-application, application/x-ms-xbap, application/vnd.ms-xpsdocument, application/xaml+xml, */*

Referer: http://localhost:8080/hello/index.jsp

Accept-Language: zh-cn,en-US;q=0.5

User-Agent: Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; Trident/4.0; InfoPath.2; .NET CLR 2.0.50727; .NET CLR 3.0.4506.2152; .NET CLR 3.5.30729)

Content-Type: application/x-www-form-urlencoded

Accept-Encoding: gzip, deflate

Host: localhost:8080

Content-Length: 13

Connection: Keep-Alive

Cache-Control: no-cache

Cookie: JSESSIONID=E365D980343B9307023A1D271CC48E7D

---------------------------此处为空行-----------------------

Keyword=hello
--------------------- 

3.2http响应头详解

①    格式

响应首行;

响应头信息;

空行;

响应体。

HTTP/1.1 200 OK

Server: Apache-Coyote/1.1

Content-Type: text/html;charset=UTF-8

Content-Length: 724

Set-Cookie: JSESSIONID=C97E2B4C55553EAB46079A4F263435A4; Path=/hello

Date: Wed, 25 Sep 2012 04:15:03 GMT

3.2.1响应码

1XX Informational(信息性状态码)接收的请求正在处理

2XX Success(成功状态码) 请求正常处理完毕

3XX Redirection(重定向状态码) 需要进行附加操作以完成请求

4XX Client Error(客户端错误状态码)服务器无法处理请求

5XX Server Error(服务器错误状态码)服务器处理请求出错

4.与目的主机断开TCP连接(四次挥手)

数据传输结束之后需要断开连接,与建立连接不同,断开连接需要多一次手,四次挥手

①浏览器向目的主机发出连接结束报文,此时进入FIN WAIT状态;

②连接结束报文标志位FIN=1,并且产生随机数M

③TCP连接结束请求报文通过ip-》Mac(arp)-》网关-》目的主机

④目的主机接收到数据帧,通过ip-》tcp,通过tcp协议单元回应结束应答报文

⑤结束应答报文中ack = M + 1,表示收到结束请求,当前只是进行回应,因为目的主机可能还有数据要传,并不急着断开连接。

⑥等到浏览器发送完所有数据后,目的主机向我的主机发出tcp连接结束请求报文;

⑦该报文FIN标志位1,并且产生随机数N,表示结束请求

⑧tcp结束请求报文通过ip-》Mac(arp)-》网关-》我的主机

⑨我的主机收到数据帧,通过ip-》tcp,tcp协议单元回应结束应答报文,此时进入TIME WAIT状态,因为不相信网络是可靠的,如果目的主机没收到,还能够重发结束应答报文

⑩该回应结束应答报文中的FIN标志为1,ack=N+1;表示结束应答,该tcp报文通过ip-》Mac(arp)-》网关-》目的主机;目的主机关闭连接,如果TIME WAIT等待结束后,没有收到回复,说明目的主机连接正常关闭了,我的主机也关闭连接

FIN WAIT状态是主动发起请求时,等待确认信息,而TIME WAIT状态是收到结束请求后发送确认信息后等待是否需要重发;

4.1为什么断开连接需要四次挥手?

因为建立连接时,目的主机可以直接发送SYN+ACK应答报文,而当目的主机收到FIN后,可能还有数据要发,并不一定直接断开,所以先发送一次应答,告知我的主机收到了连接结束请求。等确认所有数据都发完了,在发送FIN,同时等待我的主机应答,这里的FIN和ACK不能一起发送,因为可能还有数据要传输,所以需要四次

原文:https://blog.youkuaiyun.com/huangwei18351/article/details/81456228 

### 三级标题:访问 www.baidu.com 时的协议过程 当用户在本地PC浏览器中输入 `www.baidu.com` 并按下回车键时,系统会经历一系列网络协议交互,以完成从域名解析到最终网页内容展示的全过程。 浏览器首先检查本地缓存中是否已有该域名对应的IP地址。若缓存中没有记录,则会向本地DNS服务器(通常由ISP提供)发起DNS解析请求。如果本地DNS服务器缓存中也没有该域名的记录,它将代表用户发起递归查询[^1]。此过程从根域名服务器开始,根服务器会返回负责 `.com` 顶级域的服务器地址。本地DNS服务器随后向 `.com` 顶级域服务器发起请求,获取 `baidu.com` 域名的授权服务器地址。最后,本地DNS服务器向 `baidu.com` 的授权DNS服务器查询 `www.baidu.com` 的A记录,从而获取其对应的IP地址,并将结果返回给客户端浏览器[^1]。 在获取到目标服务器IP地址后,浏览器会发起与该IP地址的TCP连接。此过程通过三次握手完成:客户端发送SYN数据包,服务器回应SYN-ACK数据包,客户端再发送ACK数据包确认连接建立。连接建立后,浏览器通过HTTP或HTTPS协议向服务器发送请求[^3]。 服务器接收到请求后,根据请求内容返回相应的数据,如HTML文档、图片资源等。这些数据在传输层被分割为TCP段,每个段都包含序列号和确认号,以确保数据的可靠传输。接收端在收到数据段后,会发送确认信息,确保数据完整性和顺序正确[^3]。 当数据传输完成后,TCP连接通过四次挥手的方式关闭。客户端发送FIN数据包表示不再发送数据,服务器确认收到并回应ACK数据包。当服务器完成数据发送后,也发送FIN数据包,客户端回应ACK数据包,最终断开连接。 在整个过程中,多个协议协同工作:DNS协议用于将域名解析为IP地址,TCP协议确保数据的可靠传输,HTTP/HTTPS协议则定义了客户端与服务器之间的通信格式和方法[^2]。 ### 三级标题:示例代码 以下是一个使用Python的 `socket` 库模拟HTTP请求的示例: ```python import socket # 创建TCP socket对象 s = socket.socket(socket.AF_INET, socket.SOCK_STREAM) # 获取百度服务器IP地址 host = socket.gethostbyname('www.baidu.com') # 连接到服务器的80端口 s.connect((host, 80)) # 发送HTTP GET请求 request = "GET / HTTP/1.1\r\nHost: www.baidu.com\r\n\r\n" s.send(request.encode()) # 接收响应数据 response = s.recv(4096) print(response.decode()) # 关闭连接 s.close() ``` 该代码演示了如何通过原始TCP连接发送HTTP请求并接收响应数据的基本流程。 ### 三级标题:相关问题
评论 1
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值