前言
首先要清楚一点:
IP协议提供了将数据从A主机送到B主机的能力.
本章重点:
本篇文章着重讲解IP协议的的格式, 以及格式字段所对应的细节. 会讲解网段划分和IP地址的一些特性. 最后会讲解路由过程.
1. IP协议报头格式
请看下图:
依旧是那两个问题:
1. 如何把报头和有效载荷(数据)进行分离(解包)?
2. 如何将有效载荷进行分用?
根据8位协议这一字段。这个字段表示的是TCP或是UDP,从传输层交付给网络层时,让网络层能辨别是TCP还UDP,到达目标主机之后,根据这一字段向上交付。
协议中的每一个字段都有用处,
先列举出它们的大致作用, 后面会一一讲解:
- 4位版本号(version): 指定IP协议的版本, 对于IPv4来说, 就是4.
- 4位头部长度(header length): IP头部的长度是多少个32bit, 也就是 length * 4 的字节数. 4bit表示最大的数字是15, 因此IP头部最大长度是60字节.
- 8位服务类型(Type Of Service): 3位优先权字段(已经弃用), 4位TOS字段, 和1位保留字段(必须置为0). 4位TOS分别表示: 最小延时, 最大吞吐量, 最高可靠性, 最小成本. 这四者相互冲突, 只能选择一个. 对于ssh/telnet这样的应用程序, 最小延时比较重要; 对于ftp这样的程序, 最大吞吐量比较重要.
- 16位总长度(total length): IP数据报整体占多少个字节.
- 16位标识(id): 唯一的标识主机发送的报文. 如果IP报文在数据链路层被分片了, 那么每一个片里面的这个id都是相同的.
- 3位标志字段: 第一位保留(保留的意思是现在不用, 但是还没想好说不定以后要用到). 第二位置为1表示禁止分片, 这时候如果报文长度超过MTU, IP模块就会丢弃报文. 第三位表示"更多分片", 如果分片了的话, 最后一个分片置为1, 其他是0. 类似于一个结束标记.
- 13位分片偏移(framegament offset): 是分片相对于原始IP报文开始处的偏移. 其实就是在表示当前分片在原报文中处在哪个位置. 实际偏移的字节数是这个值 * 8 得到的. 因此, 除了最后一个报文之外, 其他报文的长度必须是8的整数倍(否则报文就不连续了).
- 8位生存时间(Time To Live, TTL): 数据报到达目的地的最大报文跳数. 一般是64. 每次经过一个路由, TTL -= 1, 一直减到0还没到达, 那么就丢弃了. 这个字段主要是用来防止出现路由循环.
- 8位协议: 表示上层协议的类型.TCP或UDP
- 16位头部校验和: 使用CRC进行校验, 来鉴别头部是否损坏.
- 32位源地址和32位目标地址: 表示发送端和接收端.
这里我们先关注4位版本, 现在用的比较多的是IPV4, 但我们国家的IPV6的专利很多, 所以国家也在推崇使用IPV6, 它们的区别后面会讲. 我们还需要关注的重点是13位片偏移, 16位标识和3位标志.
2. 分片和组装操作
由于数据链路层的物理特性, 一般无法转发太大的数据, 数据链路层一次性可以转发到网络的报文大小的限制是: (1500字节,MTU). 所以在数据传到链路层前, 要进行分片操作. 注意, 分片操作是网络层干的事情, 同理, 将不同的分片进行组装成完整的报文也是在对端的网络层进行的.
16位标记位:
由于一个报文可能会被分片成为多份, 我们需要标识来自于同一报文的分片, 所以16位标记位中存储的字段相同, 代表它们来自同一个报文.
3位标志:
第一位保留(保留的意思是现在不用,但是还没想好说不定以后要用到)。
第二位置为1表示禁止分片,这时候如果报文长度超过 MTU,IP 模块就会丢弃报文。
第三位表示"更多分片",如果分片了的话,最后一个分片置为0,其他是1,类似于一个结束标记.
13位片偏移:
是分片相对于原始IP报文开始处的偏移(不包含报头)。其实就是在表示当前分片在原报文中处在哪个位置,实际偏移的字节数是这个值除8得到的。因此,除了最后一个报文之外,其他报文的长度必须是8的整数倍,否则报文就不连续了.
注意: 分片并不是单纯的切分,而是每个分片都要包含报头.
例如,传输层要把大小为3000字节的报文传给数据链路层,那么在传输层就要进行分片操作:
关于分片和组装的其他问题:
3. 网段划分(重要)
IP地址分为两个部分: 网络号和主机号.
- 网络号: 保证相互连接的两个网段具有不同的标识;
- 主机号: 同一网段内, 主机间有相同的网络号, 但有不同的主机号;
合理设置主机号和网络号, 可以保证在相互连接的网络中, 每台主机的IP地址都不同.
过去曾经提出一种划分网络号和主机号的方案,
把所有IP 地址分为五类, 如下图所示:
这样带来的问题是B类地址被大量申请, 而A类地址几乎没人用. 并且B类地址是有限的, 如果不加管控, 可用的地址就会被掌握在少数国家手中. 于是引入了子网掩码来区分主机号和网络号.
后面又提出来一种全新的网段划分方式: 使用子网掩码(CIDR).
子网掩码的工作原理
- 子网掩码是一个32位的正整数. 通常用一串 “0” 来结尾;
- 将IP地址和子网掩码进行 “按位与” 操作, 得到的结果就是网络号;
- 网络号和主机号的划分与这个IP地址是A类、B类还是C类无关;
举两个例子:
可见,IP地址与子网掩码做与运算可以得到网络号, 主机号从全0到全1就是子网的地址范围; IP地址和子网掩码还有一种更简洁的表示方法,例如140.252.20.68/24,表示IP地址为140.252.20.68, 子网掩码的高24位是1,也就是255.255.255.0
特殊的IP地址:
- 将IP地址中的主机地址全部设为0, 就成为了网络号, 代表这个局域网;
- 将IP地址中的主机地址全部设为1, 就成为了广播地址, 用于给同一个链路中相互连接的所有主机发送数据包;
- 127. * 的IP地址用于本机环回(loop back)测试,通常是127.0.0.1
4. IP地址的数量限制
我们知道, IP地址(IPv4)是一个4字节32位的正整数. 那么一共只有 2的32次方 个IP地址, 大概是43亿左右. 而TCP/IP协议规定, 每个主机都需要有一个IP地址.
这意味着, 一共只有43亿台主机能接入网络么?
实际上, 由于一些特殊的IP地址的存在, 数量远不足43亿; 另外IP地址并非是按照主机台数来配置的, 而是每一个网卡都需要配置一个或多个IP地址.
解决方案:
5. 私有IP和公有IP(重要)
如果一个组织内部组建局域网,IP地址只用于局域网内的通信,而不直接连到Internet上,理论上 使用任意的IP地址都可以,但是RFC 1918规定了用于组建局域网的私有IP地址
- 10.*, 前8位是网络号,共16,777,216个地址
- 172.16.到172.31.,前12位是网络号,共1,048,576个地址
- 192.168. * ,前16位是网络号,共65,536个地址
- 包含在这个范围中的, 都成为私有IP, 其余的则称为全局IP(或公网IP);
私有IP对应的IP的局部的,不会出现在公网中, 所以私有IP可以在不同子网中出现重复, 这一操作大大缓解了IP地址不足的困境. 当跨子网通信时(如跨省通信,跨国通信), 再使用公网IP即可. 路由器对外对内有两套地址. 家用路由器至少要连接两个ip, 对外: WAN口IP, 自己所在的上级子网给自己分配的IP. 对内: LAN口IP, 又称为局域网IP.
路由器要做的事情:
- 将报文中的源IP替换为路由器的WAN口IP
- 每经过一个内网路由器都会做这个工作
- 在报文通过路由从内网转发到公网的过程中,把原来IP地址替换的技术, 被称为NAT技术.只是在进出内网的时候做转化
也就是说, 虽然存在公网,但是我们上网,都必须先接入指定的一个私网中,我们所有人,都在各自的内网中!世界上的公网体系其实是由多个内网组成的.
NAT IP转换过程:
这其中的细节其实很多, 但作为后端开发的我来说, 了解到这种地步就差不多了.
6. 路由过程
路由过程就是从A主机到B主机需要走的路径.
从成都出发时, 我怎么知道当前要路由到重庆?而不是路由到贵州? 其实路由器一般只做两件事:
1. 判断当前目的IP能不能直接到达, 不能直接达到就发送给下一个路由器.
2. 能直接达到就直接将数据发送给主机.
那么如何判定当前这个数据包该发送到哪里呢? 这个就依靠每个节点内部维护一个路由表.
使用route指令可查看路由表:
这台主机有两个网络接口,一个网络接口连到 192.168.0/24 网络,另一个网络接口连到 192.168.56.0/24 网络.
把路由过程抽象成动画如下:
路由表会告知你下一站应该往哪儿走.
7. 总结
结合前面所学,我们可以知道, 其实传输层提供的是"策略",比如各种机制,网络层提供的是"能力”, 真正跑腿干活,执行操作的是网络层.