1.运输层概述
1.1 为什么需要运输层
网络层最终解决的问题分组从一台主机经过网络到达另一台主机,即主机到主机间的通信。
网络层没有解决的问题:
- 主机中谁发送的数据、谁接收数据?
- IP 分组无序到达目的主机,接收进程如何处理?
- 可靠传输问题。
1.2 运输层的作用
“逻辑通信”的意思是“好像是这样通信,但事实上并非真的这样通信”:
- 从 IP 层来说,通信的两端是两台主机。但“两台主机之间的通信”这种说法还不够清楚;
- 严格地讲,两台主机进行通信就是两台主机中的应用进程互相通信;
- 从运输层的角度看,通信的真正端点并不是主机而是主机中的进程。也就是说,端到端的通信是应用进程之间的通信。
网络层与运输层有明显的区别:
1.3 运输层复用和分用
在一台主机中经常有多个应用进程同时分别和另一台主机中的多个应用进程通信。
表明运输层有一个很重要的功能:
- 复用(multiplexing);
- 分用(demultiplexing)。
根据应用程序的不同需求,运输层需要有两种不同的运输协议:
- 即面向连接的 TCP;
- 无连接的 UDP。
1.4 TCP 与 UDP(逻辑信道的差异性)
运输层的逻辑通信信道的差别:
- 当运输层采用面向连接的 TCP 协议时,尽管下面的网络是不可靠的,但这种逻辑通信信道就相当于一条全双工的可靠信道;
- 当运输层采用无连接的 UDP 协议时,这种逻辑通信信道是一条不可靠信道。
TCP靠谱,UDP不靠谱。
可靠信道与不可靠信道:
2.TCP 与 UDP
2.1 运输层协议
- 用户数据报协议 UDP(User Datagram Protocol);
- 传输控制协议 TCP(Transmission Control Protocol)。
两个对等运输实体传送的数据单元称为运输协议数据单元 TPDU(Transport Protocol Data Unit):
- TCP 传送的数据单位是 TCP 报文段(segment);
- UDP 传送的数据单位是 UDP 报文或用户数据报。
2.2 UDP 和 TCP 协议特点
UDP 协议:
- 不需要先建立连接,提供无连接服务;
- 协议数据单元为 UDP 报文或用户数据报;
- 收到 UDP 报文后,无需任何确认;
- UDP 不提供可靠交付;
- 简单、支持单播、多播、广播;
- 适用于多媒体应用。
TCP 协议:
- 提供面向连接的服务;
- 传送的数据单位协议是 TCP 报文段(segment);
- TCP 不提供广播或多播服务;
- 收到 TCP 报文段后,需要确认;
- 协议复杂、开销大,占用较多的处理机资源;
- 应用较多:万维网、电子邮件、文件传送等。
2.3 UDP 和 TCP 协议典型应用
2.4 IP 与 TCP 的区别
运输层的 UDP 用户数据报与网际层的 IP 数据报有很大区别:
- IP 数据报要经过互联网中许多路由器的存储转发;
- UDP 用户数据报是在运输层的端到端抽象的逻辑信道中传送的。
TCP 报文段是在运输层抽象的端到端逻辑信道中传送的:
- 这种信道是可靠的全双工信道;
- 这种信道不知道究竟经过了哪些路由器,而这些路由器也根本不知道上面的运输层是否建立了 TCP 连接。
2.5 运输层端口
🍀 为什么需要运输层的端口
为了使运行不同操作系统的计算机的应用进程能够互相通信,就必须用统一的方法对 TCP/IP 体系的应用进程进行标志:
- 运行在计算机中的进程是用进程标识符来标志的;
- 但应用层的各种应用进程却不应当让计算机操作系统指派它的进程标识符。这是因为在互联网上使用的计算机的操作系统种类很多,而不同的操作系统口使用不同格式的进程标识符。
🍀 需要解决的问题
由于进程的创建和撤销都是动态的,发送方几乎无法识别其他机器上的进程。
有时我们会改换接收报文的进程,但并不需要通知所有发送方。
我们往往需要利用目的主机提供的功能来识别终点,而不需要知道实现这个功能的进程。
解决这个问题的方法就是在运输层使用协议端口号(protocol portnumber)。
通信的终点是应用进程,但可以把端口想象是通信的终点,只要把要传送的报文交到目的主机的目的端口,剩下的工作(即最后交付目的进程)由TCP 来完成。
🍀 端口的概念
端口用一个 16 位端口号 进行标志:
- 端口号只具有本地意义,即端口号只是为了标志本计算机应用层中的各进程;
- 两个计算机中的进程要互相通信,不仅必须知道对方的 IP 地址(为了找到对方的计算机),而且还要知道对方的端口号(为了找到对方计算机中的应用进程)。
🍀 两大类端口
服务器端使用的端口号:
-
熟知端口:数值一般为 0~1023(全世界都知道的);
-
登记端口号:数值为 1024~49151,给没有熟知端口号的应用程序使用的。使用这个范围的端口号必须在 IANA 登记,以防止重复。
IANA 是 Internet Assigned Numbers Authority(互联网数字分配机构)的缩写。它是一个全球性的组织,负责管理互联网的一些关键资源,包括 IP 地址、域名系统(DNS)和互联网协议(IP)参数。
IANA 的主要职责包括:
- IP 地址分配:IANA 分配全球唯一的 IP 地址块给地区互联网注册管理机构(RIRs),然后由 RIRs 进一步将 IP 地址分配给互联网服务提供商和其他组织。
- 域名系统(DNS)管理:IANA 维护全球顶级域名(例如 .com、.org、.net)和国家顶级域名(例如 .us、.cn、.uk)的根域名服务器。它负责管理域名的根区域文件,并确保域名系统的正常运行。
- 互联网协议(IP)参数分配:IANA 分配和管理互联网协议相关的参数,例如端口号、协议号、参数编号等。这些参数对于确保互联网各种协议的正常运行和互操作性非常重要。
IANA 是由互联网工程任务组(IETF)和互联网号码分配机构(ICANN)监督和协调的。它的工作对于互联网的稳定运行和全球互联网资源的合理分配起着重要作用。
客户端使用的端口号:
- 又称为短暂端口号,数值为 49152~65535,留给客户进程暂时使用;
- 当服务器进程收到客户进程的报文时,就知道了客户进程所使用的动态端口号。通信结束后,这个端口号可供其他客户进程以后使用。
🍀 常用熟知端口号
保存有常用的熟知端口号的文件:
- linux 中的 /etc/services
- Windows 中的 C:Windows/System32/drivers/etc/services
3.UDP 协议
3.1 用户数据报 UDP
UDP 只在 IP 的数据报服务之上增加了很少一点的功能:
- 复用和分用的功能;
- 差错检测的功能。
虽然 UDP 用户数据报只能提供不可靠的交付,但 UDP 在某些方面有其特殊的优点。
3.2 UDP 的主要特点
- 不需要建立连接:减少开销和发送数据之前的时延;
- 尽最大努力交付:即不保证可靠交付;
- 面向报文的:一次交付一个完整的报文;
- 没有拥塞控制:网络出现拥塞不会降低源主机的发送速率;
- 支持多种交互通信:支持一对一、一对多、多对一和多对多的交互通信;
- 首部开销小:8个字节,比 TCP的 20 个字节的首部要短。
📍 什么是“面向报文的 UDP”?
发送方 UDP 对应用程序交下来的报文,添加首部后就向下交付 IP 层:
- 应用层交给 UDP 多长的报文,UDP 就照样发送,即一次发送一个报文;
- UDP 对应用层交下来的报文,既不合并,也不拆分,保留这些报文的边界;
接收方 UDP 去除 UDP 报文首部,原封不动地交付上层的应用进程,一次交付一个完整的报文 。
应用层产生数据交给 UDP,UDP 打包并直接送到网络层。
应用程序必须选择合适大小的报文:
- 若报文太长,UDP 把它交给 IP 层后,IP 层在传送时可能要进行分片,这会降低IP 层的效率;
- 若报文太短,UDP 把它交给 IP 层后,会使IP 数据报的首部相对长度太大,这也降低了 IP 层的效率。
3.3 UDP 协议的使用场景
可以重复请求信息的情况下,例如:DNS、DHCP,一次性传小量数据的应用(面向报文的)。
实时应用:
- IP 电话、视频会议等;
- 多媒体应用。
3.4 UDP 的首部格式(语法、语义)
3.5 检验和计算:伪首部
伪首部不是 UDP 真实首部,仅仅是为了计算检验和。
可以理解为 UDP 的两次检查:
- 一次是对 IP 地址进行检验,确认该 IP 分组是发送给本机的;
- 一次是对端口号和数据进行检验,确认交给哪个进程并且数据是无误的。
发送方:
- 增加伪首部;
- UDP 首部检验和填充 0;
- 数据部分填充 0 至 4 字节整数倍;
- 计算机检验和,伪首部+首部+数据;
- 首部填上检验和;
- 删除伪首部,发送UDP数据报。
接收方:
- 增加伪首部
- 计算机检验和,伪首部+首部+数据;
- 检验和全 1 无差错,否则丢弃或上交应用进程(附上错误警告)。
3.6 抓取 UDP 用户数据报(DNS 查询)
4.TCP 协议
4.1 基本介绍
TCP 是面向连接的:
- TCP 连接只能有两个端点,TCP 连接是点对点的(一对一);
- TCP 提供可靠交付的服务;
- TCP 提供全双工通信。
面向字节流:
- TCP 中的“流”(stream)指的是流入或流出进程的字节序列;
- 面向字节流的含义是:虽然应用程序和 TCP 的交互是一次一个数据块,但 TCP 把应用程序交下来的数据看成仅仅是一连串无结构的字节流。
4.2 面向连接的概念
-
面向连接的电路交换(物理层保证可靠):通信双方之间必须有一条物理连接的通路(直接相连),且被通信双方独享,数据按序发送并按序接收。
-
面向连接的虚电路(网络层保证可靠):通信双方采用复用技术,逐段占用物理通路,每段物理通路可被多对通信使用,分组按序发送并按序接收。
-
面向连接 TCP(运输层协议保证可靠):采用协议的方法(确认、序号、重传),确保通信双方有一条全双工的、可靠的逻辑信道(事实上,提供服务的 IP 数据报是不可靠的),字节按序发送并按序接收(但网络层 IP 数据报并不一定按序到达)。
TCP 不保证接收方应用程序所收到的数据块和发送方应用程序所发出的数据块具有对应大小的关系。
接收方应用程序收到的字节流必须和发送方应用程序发出的字节流完全一样。
4.3 面向字节流的概念
- TCP 不关心应用进程一次把多长的报文发送到 TCP 缓存;
- TCP 对连续的字节流进行分段,形成 TCP 报文段;
- TCP 根据对方给出的窗口值和网络拥塞程度决定报文段应包含多少个字节;
- TCP 可把长的数据块划分短一些再传送;
- TCP 也可等待积累有足够多的字节后再构成报文段发送出去。
4.4 TCP 连接的概念
TCP 把连接作为最基本的抽象:
- 每一条 TCP 连接有两个端点;
- TCP 连接的端点不是主机,不是主机的 IP 地址,不是应用进程,也不是运输层的协议端口;
- TCP 连接的端点叫做**套接字(socket)**或插口;
- 端口号拼接到(contatenated with)IP 地址即构成了套接字。
套接字 socket = (IP 地址 : 端口号)
TCP 连接 = {socket1, socket2} = {(IP1 : port1), (IP2 : port2)}
- 同一个 IP 地址可以有多个不同的 TCP 连接;
- 同一个端口号也可以出现多个不同的 TCP 连接。