当你在浏览器中输入一个地址(一)——浏览器检查地址

本文深入解析浏览器接收URL后的处理流程,包括地址有效性检查、访问方式选择、安全性和缓存机制,探讨HTTP与HTTPS的区别及安全考量。

浏览器是我们日常都会用的一个软件,那么,当你向浏览器的地址栏输入一个地址(URL)时,它背后究竟发生了哪些故事呢?

浏览器检查地址

1 检查地址的有效性

对于浏览器来说,一般可以支持两种地址的输入:IP(192.xxx.xxx.xxx)直接访问和通过域名(www.xxx.com)访问。在你输入一个地址后,浏览器最先做的就是检查你的地址是否“合法”。譬如,用IP的时候有超过255的数字、域名中有非法字符等。只有当你正确输入一个地址,浏览器才会按照你的指令进行以下步骤。否则,(现在的)浏览器会认为你想在搜索引擎中搜索这段字符串。

2 检查访问方式(http or https)

假设你已输入正确,此时浏览器会检测你的访问方式。访问方式有HTTP和HTTPS两种,区别如下:

  • https是http协议的安全版本,http协议的数据传输是明文的,是不安全的;https使用了SSL/TLS协议进行了加密处理,需要先建立SSL加密通道再进行通信,有效防止不安全访问。
  • http和https使用连接方式不同,默认端口也不一样,http是80,https是443。

由于http的明文传输机制安全性很差,因此大部分网站现已转为https。但如果你不指定明确的访问方式,浏览器依旧会默认使用http进行访问。为了能使你顺利到达https的访问通道,网站开发者想出了下图的办法让你的http访问转化成https访问,即当你请求80端口时,服务器会返回一条重定向至443端口的信息,让你的浏览器重新请求443端口。

此时问题来了,你和服务器之间出现了坏人!(他甚至可能是你的网络运营商,如果真是的话https拿他也经常没得办法咯)他可能通过路由劫持、DNS劫持等方式劫持了你的网络,比如劫持了你的80端口,就会出现下图中的“中间人劫持攻击”。坏人可以根据他的目的,在原网页中植入广告、钓鱼网站等不良信息,再发送给你的浏览器。

一种常用的解决方案是使用HTST,在此不再详述。读者请自行搜索了解。

3 其他检查

除了上述检查,浏览器还会进行一些额外的操作,比如安全检查、访问限制(比如某些网站emmmm)。

4 浏览器缓存 

最后,浏览器将检查自己的缓存情况,来决定下一步的行为,如图所示。其中要注意的是,RFC 规定,如果 ETag 和 Last-Modified 都有,则必须一次性都发给服务器,没有优先级。如果服务器输出了 ETag,没有必要再输出 Last-Modified。

 

ETag是LastModifed的补充,有些动态生成的内容就可以用md5做ETag控制缓存了。ETag比lastModified更加严谨,如果资源发生变化,ETag就会发生变化,就会把最新的资源给客户端返回去,而LastModified不识别s(秒)单位里的修改,所以如果资源在s(秒)单位里发生了修改,那LastModified也不会发生改变,这样如果只用了LastModified,客户端得到的资源就不是最新的;但是设定了ETag之后,每次客户端发出请求,服务端都会根据资源重新生成一个ETag,对性能有影响。

ETag只在特定情况下才更有用,比如同一url的资源在不同条件下返回不同的内容。而现实中一般会通过各种方法来避免这样的情况出现,因为这样容易消耗更多资源。相比而言,LastModified一般情况下一般足够,且LastModified更快,并且是web服务器自动支持的。因此默认使用LastModified,有需要的情况下才用ETag

<think> 嗯,用户想了解输入域名回车后的完整过程。这个问题看似常见,但涉及计算机网络多个核心层面,需要系统性地梳理。 用户提供的四个引用材料很有价值,特别是引用[3]的八个步骤框架非常清晰,但需要补充技术细节。引用[1]提到的DNS解析比喻和引用[4]的路由缓存机制也值得整合。 考虑从物理操作到最终渲染的完整链路展开: 首先必须强调DNS解析的细节,包括浏览器缓存→hosts文件→本地DNS服务器的查询顺序,这点引用[4]的路由缓存描述很准确。TCP三次握手部分要解释SYN/ACK包交换过程,但避免术语堆砌。 注意到引用[2]提到HTTP请求头细节容易被忽略,比如User-Agent和Accept字段,这部分对理解浏览器行为很重要。页面渲染环节需要补充关键路径渲染(Critical Rendering Path)的概念,解释HTML/CSS/JS如何变成像素。 安全机制是用户没问但必须涵盖的:TLS握手在HTTPS场景的触发时机,以及证书验证过程。引用材料中都没提到Service Worker等现代特性,考虑在异步请求环节补充。 最后要强调流程的非线性——浏览器预解析、连接复用等优化手段会使某些步骤并行。用户可能是开发者或面试准备者,考虑在回答末尾添加三个进阶问题:关于HTTP/3的QUIC协议、前端性能优化切入点、网络安全防护层,形成知识闭环。 </think> 在浏览器输入域名(如 `www.example.com`)并按下回车后,整个流程涉及网络协议栈、操作系统浏览器引擎的协同工作。以下是详细步骤: --- ### 🌐 **1. URL解析** - 浏览器解析输入内容: - 若输入非完整URL(如 `example`),浏览器尝试补全协议(`https://`)和后缀(`.com`)。 - 特殊输入(如直接输入IP)跳过DNS解析。 - 检查**HSTS列表**(强制HTTPS的域名)[^4]。 --- ### 🔍 **2. DNS解析(获取服务器IP)** 1. **浏览器缓存**:检查本地DNS缓存(如 Chrome 的 `net-internals`)。 2. **系统缓存**:查询操作系统 hosts 文件(如 Windows 的 `C:\Windows\System32\drivers\etc\hosts`)。 3. **路由器缓存**:向本地路由器发送 DNS 查询。 4. **ISP DNS服务器**: - 递归查询根域名服务器 → 顶级域(`.com`)服务器 → 权威域名服务器。 - 最终返回目标域名的 IP 地址(如 `93.184.216.34`)[^1][^3][^4]。 > **比喻**:DNS 解析如同查找电话号码簿,将域名“翻译”为服务器 IP。 --- ### 🤝 **3. 建立TCP连接(三次握手)** - **步骤**: 1. 客户端发送 `SYN` 包(序列号 `x`)。 2. 服务器回复 `SYN-ACK` 包(序列号 `y`,确认号 `x+1`)。 3. 客户端发送 `ACK` 包(确认号 `y+1`)。 - 若为 HTTPS 请求,后续启动 **TLS 握手**(交换密钥、验证证书)[^2][^3]。 --- ### 📤 **4. 发送HTTP请求** 浏览器构造 HTTP 请求报文: ```http GET /index.html HTTP/1.1 Host: www.example.com User-Agent: Mozilla/5.0 Accept: text/html,application/xhtml+xml Cookie: session_id=abc123 ``` - 包含请求行、请求头、空行及可能的请求体(如 POST 数据)[^3]。 --- ### ️ **5. 服务器处理请求** - Web 服务器(如 Nginx/Apache): 1. 解析请求路径和参数。 2. 执行后端逻辑(如 PHP/Python 脚本)。 3. 查询数据库或缓存。 4. 生成 HTTP 响应(状态码 + HTML/CSS/JS 等资源)[^3][^4]。 --- ### 📥 **6. 接收响应** 服务器返回响应报文: ```http HTTP/1.1 200 OK Content-Type: text/html; charset=UTF-8 Content-Length: 1234 <!DOCTYPE html><html>...</html> ``` - 状态码(如 `200` 成功、`404` 未找到)决定后续行为[^2]。 --- ### **7. 浏览器渲染页面** 1. **解析 HTML**:构建 DOM 树。 2. **解析 CSS**:生成 CSSOM 树。 3. **合并渲染树**(DOM + CSSOM)。 4. **布局**(Layout):计算元素位置和尺寸。 5. **绘制**(Paint):将像素输出到屏幕。 6. **执行 JavaScript**: - 若遇到 `<script>` 标签,暂停解析直至脚本执行完成(除非标记 `async/defer`)。 - 触发事件(如 `DOMContentLoaded`)[^1][^3]。 --- ### ♻️ **8. 异步请求与连接关闭** - **异步请求**:页面加载后,JavaScript 可能发起 Ajax/Fetch 请求更新内容。 - **关闭 TCP连接**(四次挥手): 1. 客户端发送 `FIN`。 2. 服务器回复 `ACK`。 3. 服务器发送 `FIN`。 4. 客户端回复 `ACK`(连接终止)[^3][^4]。 --- ### **关键优化机制** - **连接复用**:HTTP/1.1 默认长连接(`Connection: keep-alive`),减少握手开销。 - **管线化(Pipelining)**:并行发送多个请求(HTTP/2 进步优化)。 - **预解析**:浏览器在解析 HTML 时提前发起 DNS 查询或 TCP 连接。 --- ### 📚 **相关问题** 1. **DNS 解析为何需要递归与迭代结合?** > 本地 DNS 服务器迭代查询根域和顶级域,客户端只需等待最终结果(递归)[^1]。 2. **HTTPS 的 TLS 握手具体如何加密数据?** > 通过非对称加密交换会话密钥,后续通信使用对称加密(如 AES)保证效率[^4]。 3. **浏览器渲染遇到 JavaScript 阻塞如何处理?** > 使用 `async`(异步加载)或 `defer`(延迟执行)避免阻塞 DOM/CSSOM 构建[^3]。 --- > 流程中各环节高度依赖缓存(DNS/TCP/HTTP)和协议优化(如 HTTP/2 多路复用),实际过程可能因浏览器策略(预加载、预渲染)而并行提速 [^1][^2][^3][^4]。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值