网络层IP协议报头字段的认识

原创已于 2025-02-22 20:43:34 修改 · 1.8k 阅读

20 ·

CC 4.0 BY-SA版权

文章标签：

#tcp/ip #linux #centos

于 2024-08-09 20:50:16 首次发布

Linux 专栏收录该内容

27 篇文章

订阅专栏

认识IP协议

IP协议（Internet Protocol），又称网际协议，是整个TCP/IP协议栈中的核心协议之一，位于网络层。IP协议是互联网中最基础的网络协议之一，负责在网络中传输数据包。它定义了数据包的格式、地址分配和路由选择等功能。IP协议通过使用IP地址作为唯一识别码，将数据报从源主机发送到目标主机，为数据包的传输提供了地址分配、路由选择、分片与重组等功能，使得不同主机之间的通信成为可能。tcp协议为数据传输提供了方法，而ip协议提供了数据传输的能力。

IP报头字段的认识

4位版本号(version): 指定IP协议的版本, 对于IPv4来说，就是4
4位首部长度：表示的就是IP报文除去有效载荷的长度，而四位表示的正好是[0,15]，而字节单位是四字节，所以四位首部长度所表示的范围就是[0,60]字节，减去20字节就是选项长度。
十六位总长度：表示范围就是[0,2^16 - 1]字节，减去四位首部长度*4就是有效载荷的数据长度。
八位上层协议：表示的就是上层传输层所用到的协议，主要让接收方可以读取到，能够用相同的协议进行接收读取报文。
8位服务类型(Type Of Service): 3位优先权字段(已经弃用)，4位TOS字段，和1位保留字段(必须置为0)。4位TOS分别表示：最小延时，最大吞吐量，最高可靠性，最小成本。这四者相互冲突，只能选择一个。对于ssh/telnet这样的应用程序，最小延时比较重要；对于ftp这样的程序，最大吞吐量比较重要。
8位生存时间(Time To Live, TTL)：数据报到达目的地时经过路由器的最大跳数。一般是64。每次经过一个路由，TTL -= 1，一直减到0还没到达, 那么就丢弃了。这个字段主要是用来防止出现路由循环。
16位头部校验和：使用CRC进行校验, 来鉴别头部是否损坏。
32位源地址和32位目标地址：表示发送端和接收端

对于IP报头的第二行字段的作用其实就是用来控制数据从应用层到数据链路层时的报文要小于MTU（Maximum Transmission Unit，最大传输单元）一般默认通常是1500字节，也就是数据帧要小于1500字节，如果IP层发送到数据链路层的报文大小超过MTU值，那么数据在发送到数据链路层之前将被分割成较小的数据包。也就是IP层的分片与组装：

IP层的分片与组装

16位标识(id)：唯一的标识主机发送的报文。如果IP报文在数据链路层被分片了，那么每一个片里面的这个标识id都是相同的。
3位标志字段：第一位保留(保留的意思是现在不用, 也就是还没想好，说不定以后要用到)。第二位置为1表示禁止分片（一般都是0），这时候如果报文长度超过MTU，IP模块就会丢弃报文。第三位表示“更多分片”，如果分片了的话，最后一个分片置为0（如果没分片也是0），其它是1。类似于一个结束标记。
13位分片偏移(framegament offset)：是分片相对于原始IP报文开始处的偏移。其实就是在表示当前分片在原报文中处在哪个位置。实际偏移的字节数是这个值 * 8 得到的。因此，除了最后一个报文之外，其他报文的长度必须是8的整数倍（因为总长度是16位，而片偏移是13位，而恰好8=2^3），否则报文就不连续了。

而我们在每一次分片的时候都需要重新添加IP报头到新分片的报文前面（需要报头中的分片属性来进行组装）。而报头的长度一般都是和分片前是一样的，16位总长度就要重新根据新的分片报文计算，而3位标志字段可能会发生改变，13位分片偏移的数值也不一样。

分片过程：

组装过程：

根据3位标志如果为0，并且13位片偏移也为0的话就表明没分片。否则就表明分片了。
根据16位标识id进行收集所有分片的报文。
报文收取顺序：根据当前报文的13位片偏移的大小＋当前报文长度就是下一个报文的片偏移值。开头报文,13位片偏移为1，而最后一个分片的3位标志为0。

我们要知道ip层进行分片其实是不好的。因为传输层tcp保证了可靠传输，而tcp将报文下交给ip层时，ip层会检查tcp的报文长度+自己网络层的报头与MTU对比，如果大于最大传输单元是会进行分片的，然后再进行下层封装依次发送出去，此时如果分片的报文其中任意一段发生了丢包的话，那么对于tcp层而言就是上次发送的数据丢包了，要进行超时重传，所以会将整个报文重新再次发送。所以说分片处理其实间接的增加了丢包的概率。

网络中数据从上向下交付的过程理解

我们的数据从应用层向下传输的过程中其实就是sk_buff缓冲区的数据进行向下交付。也就是说：当发送数据报时，Linux内核的网络模块会建立一个包含要传输数据的sk_buff的缓冲区，然后将它传递给下一层，每层在sk_buff中添加不同的协议头，直到交给网络设备发送（抽象来说就类似于入栈过程）。

当数据包被接收时，网络设备将接收到的数据转换为sk_buff，并传递给上层，每层剥去（解析）相应的协议头后直到将有效载荷数据内容交给用户。

网段划分

网络号：保证相互连接的两个网段具有不同的标识。

主机号：同一网段内，主机之间具有相同的网络号，但是必须有不同的主机号。

而路由器就是至少要连接两个子网，才能进行跨网络进行数据发送。路由器是可以构建子网的，当计算机发送申请然后连接到路由器的无线网络的时候就可以进行上网，这是因为，路由器还在该网段内为你的计算机分配一个同网络号不同主机号的IP地址，也就是管理局域网下的IP地址（即DHCP技术）。

也就是DHCP应用层协议：是一个局域网的网络协议，用于集中管理和自动分配IP地址等网络配置信息给网络中新增的的主机。

曾经提出一种划分网络号和主机号的方案, 把所有IP 地址分为五类, 如下图所示:

随着Internet的飞速发展,这种划分方案的局限性很快显现出来,大多数组织都申请B类网络地址, 导致B类地址很快就分配完了, 而A类却浪费了大量地址。

例如, 申请了一个B类地址, 理论上一个子网内能允许6万5千多个主机. A类地址的子网内的主机数更多。然而实际网络架设中, 不会存在一个子网内有这么多的情况。因此大量的IP地址都被浪费掉了。

所以针对这种情况提出了新的划分方案，称为CIDR(Classless Interdomain Routing)：

引入一个额外的子网掩码(subnet mask)来区分网络号和主机号；
子网掩码也是一个32位的正整数。通常用一串 "0" 来结尾；
将IP地址和子网掩码进行 "按位与" 操作, 得到的结果就是网络号；
网络号和主机号的划分与这个IP地址是A类、B类还是C类无关;

子网划分的好处：

提高定位和查找主机的效率。
提高管理性和IP地址利用率。

公网IP和私有IP

私有IP地址

私有IP地址是指仅在局域网（LAN）内部使用的IP地址，这些地址在Internet上是不可见的，也不会被路由到公网上。它们主要用于内部网络设备的互连，以便在不需要公网访问的情况下，设备之间可以相互通信。

范围：常见的私有IP地址范围包括三个主要块：
- 10.0.0.0 到 10.255.255.255（10.0.0.0/8）
- 172.16.0.0 到 172.31.255.255（172.16.0.0/12）
- 192.168.0.0 到 192.168.255.255（192.168.0.0/16）
特点：
- 只能在内部网络中使用。
- 无需向任何机构申请，可自由分配。
- 提高了内部网络的安全性，因为外部设备无法直接访问这些地址。
- 需要通过NAT（网络地址转换）等技术来实现内部网络与公网的通信。

公网IP地址

公网IP地址是指可以直接在Internet上被访问和路由的IP地址。这些地址由Internet服务提供商（ISP）或其他相关机构分配给组织或个人，以便他们能够与其他Internet上的设备进行通信。

特点：
- 可以在全球范围内唯一标识一台设备。
- 需要向ISP或其他相关机构申请并支付费用（在某些情况下可能是免费的）。
- 可用于远程访问内部网络资源，如远程桌面、VPN服务等。
- 安全性较低，因为直接暴露在Internet上，容易受到攻击。

总结：私有IP地址主要用于内部网络的互连和通信，而公网IP地址则用于设备在Internet上的唯一标识和通信。在实际应用中，通常会通过NAT等技术将内部网络的私有IP地址转换为公网IP地址，以实现内部设备与Internet的通信。

内网IP不能出现在公网中

从以上图中不难看出每个路由都是配置了两个IP，一个是子网（LAN口）IP一个是WAN口IP。

而路由器LAN口连接的主机都是从属于当前路由器的子网中。不同的路由器, 子网IP其实都是一样的(通常都是192.168.1.1)。子网内的主机IP地址不能重复。但是子网之间的IP地址就可以重复了。如图的三个家用路由器所连接的用户ip地址都是相同的，所以私有IP地址在Internet上不是唯一的。
每一个家用路由器，其实又作为运营商路由器的子网中的一个节点。所以说WAN口IP是指连接外部网络（如互联网）的接口（WAN口）所使用的IP地址。这样的运营商路由器可能会有很多级，但是最外层的运营商路由器 WAN口IP就一定是一个公网IP。
子网内的主机需要和外网进行通信时, 路由器将IP首部中的IP地址进行替换(替换成WAN口IP)，这样逐级替换，最终数据包中的IP地址成为一个公网IP。这种技术称为NAT(Network Address Translation，网络地址转换)。而NAT技术就是：任何一个内网路由器在转发报文的时候，都要将榜文中的源IP替换成路由器的WAN口IP。
所以内网IP不能出现在公网中的原因：因为它们是私有IP地址，不是全球唯一的，无法直接在Internet上进行路由和寻址。

IP地址数量有限与解决

我们知道， IP地址(IPv4)是一个4字节32位的正整数。那么一共只有 2的32次方个IP地址，大概是43亿左右。而TCP/IP协议规定，每个主机都需要有一个IP地址。这意味着，一共只有43亿台主机能接入网络实际上，由于一些特殊的IP地址的存在，数量远不足43亿；另外IP地址并非是按照主机台数来配置的，而是每一个网卡都需要配置一个或多个IP地址。

CIDR在一定程度上缓解了IP地址不够用的问题(提高了利用率, 减少了浪费, 但是IP地址的绝对上限并没有增加), 仍然不是很够用。这时候有三种方式来解决:

动态分配IP地址：只给接入网络的设备分配IP地址。因此同一个MAC地址的设备，每次接入互联网中，得到的IP地址不一定是相同的；
NAT技术；
IPv6：IPv6并不是IPv4的简单升级版。这是互不相干的两个协议，彼此并不兼容；IPv6用16字节128位来表示一个IP地址；但是目前IPv6还没有普及;

IP的路由过程

IP数据包的传输过程也和问路一样：

当IP数据包到达路由器时，路由器会先查看目的IP，通过目的IP和子网掩码按位与得到网络号，根据网络号路由器决定这个数据包是能直接发送给目标主机，还是需要发送给下一个路由器，依次反复，一直到达目标IP地址。

而如何判定当前这个数据包该发送到哪里呢? 这个就依靠每个节点内部维护一个路由表

主要就是判断目的IP是否命中了路由表中其中行IP，从而决定是转发到主机还是就按缺省路由条目规定的接口发送到下一跳地址。