传输层
基本概念
传输层只有主机才有,而路由器这种中间设备至多只有物理层、数据链路层和网络层三层架构。
是面向通信的最高层,也是用户功能的最底层。
传输层的功能
- 传输层提供进程与进程之间的逻辑通信。
- 复用与分用。(复用:应用层所有的应用进程都可以通过传输层再传输到网络层;分用:传输层从网络层收到数据后交付指明的应用进程)
- 差错检测。
寻址与端口
- 端口(逻辑端口/软件端口):是传输层的SAPSAPSAP,标识主机中的应用进程。
- 每一个端口有用于区分的端口号,只有本地意义,因特网中不同主机的相同端口号无联系。
- 端口号长度为16bit16bit16bit,能标识655366553665536个不同的端口号。
- 端口号按范围划分可以分为:
- 服务端使用的端口号:
- 熟知端口号(0−10230-10230−1023):给TCP/IPTCP/IPTCP/IP最重要的一些应用程序,让所有用户都知道。
- 登记端口号(1024−491511024-491511024−49151):为没有熟知端口号的应用程序使用。
- 客户端使用的端口号:仅在客户进程运行时才系统动态分配。
- 服务端使用的端口号:
- 套接字SocketSocketSocket=(主机IPIPIP地址,端口号)。唯一标识了网络中的一个主机和它上面的一个进程。如果有新的同样套接字的连接请求建立,则建立失败,不影响原有连接。
常用的端口号:
应用程序 | 熟知端口号 |
---|---|
FTP数据 | 20 |
FTP控制 | 21 |
TELNET | 23 |
SMTP | 25 |
DNS | 53 |
TFTP | 69 |
HTTP | 80 |
POP3 | 110 |
SNMP | 161 |
HTTPS | 443 |
UDP协议
用户数据报协议只在IPIPIP数据报服务之上添加了两个功能,即只有复用分用(接收方的传输层剥去报文首部后,能把这些数据正确交付到目的进程。通过目的端口实现)与差错检测功能。
主要特点
- 无连接,减少开销和发送数据之前的时延。
- 使用最大努力交付,而非保证可靠交付。所以不会对报文编号。
- 面向报文(不对报文拆分,应用层给多长报文,UDPUDPUDP就会照样一次发送一个完整报文),适合一次性传输少量数据的网络应用。
- 无拥塞控制,适合很多实时应用,实时应用延迟要求高,需要立即响应。
- 支持一对一、一对多、多对一、多对多的交互通信。
- 首部开销小,8B8B8B,而TCPTCPTCP需要20B20B20B。
因为UDPUDPUDP不保证可靠性,所以其可靠性由应用层完成。
UDP数据报格式
- 源端口号:需要对方回应时选用,如果不需要回应,可以不填,即是全000的。
- 目的端口号:是必填的。分用时,如果找不到对应的目的端口号就丢弃该报文,并向发送方发送ICMPICMPICMP端口不可达差错报告报文。
- UDPUDPUDP长度:整个UDPUDPUDP用户数据报的长度,首部加上数据部分。最小值为888。以字节为单位。不包括伪首部。
- UDPUDPUDP检验和:检测整个UDPUDPUDP数据报是否有错(伪首部+首部+数据,而IPIPIP只检测首部),错就丢弃。若不想校验则是全000。若计算结果为全000则置为全111。
UDP协议校验和
具体的UDPUDPUDP数据报格式如下:
- 伪首部只有在计算检验和时才出现,不向下传达也不向上提交。
- 其中的171717代表封装UDPUDPUDP报文的IPIPIP数据报首部协议字段是171717。
- UDPUDPUDP长度是UDPUDPUDP首部8B8B8B加上数据长度,不包括伪首部。
发送端:
如果不使用校验和字段,则字段全部填充000。
- 填上12B12B12B的伪首部。
- 全000填充检验和字段。
- UDPUDPUDP数据报要看成许多161616位的字符串连接一起,全000填充数据部分末尾,使数据报成为偶数个字节。
- 伪首部+首部+数据部分采用二进制反码求和。
- 二进制反码运算求和再取反填入校验和字段。
- 去掉伪首部进行发送。
接收端:
如果校验和字段计算结果恰好为000,则表示错误,字段全部填充111。
- 填上伪首部,若不是偶数个字节还要在末尾加000。
- 伪首部+首部+数据部分采用二进制反码求和。
- 如果结果全为111则无差错,否则出错,丢弃或交给应用层并附上出错的警告。
![UDP校验][UDPcheck]
TCP协议
传输控制协议对比用户数据报协议更复杂。
TCP协议主要特点
- 是面向连接(虚连接)的传输层协议。
- 每一条TCPTCPTCP连接只能有两个端点,所以连接是一对一的。
- 提供可靠有序的服务,无差错不重复(使用确认机制)。
- 提供全双工通信,包含发送缓存(准备发送的数据与已放送但是未确认的数据)与接受缓存(按序到达但是未被读取的数据与不按序到达的数据)。
- 面向字节流。TCPTCPTCP把应用程序交下来的数据看成一连串的无结构字节流。
TCP数据报格式
TCPTCPTCP传输的数据单位称为报文段。可以用来传输数据,也可以用来建立连接、释放连接、应答。长度为4B4B4B整数倍,默认最短为20B20B20B,报头最长为60B60B60B。
![TCP报文段格式][TCPformat]
- 源端口和目的端口:各2B2B2B。
- 序号:在一个TCPTCPTCP连接中传送的字节流中的每一个字节都按顺序编号,本字段表示本报文段所发送数据的第一个字节的序号。范围为0∼232−10\sim2^{32}-10∼232−1。
- 确认号:期望收到对方下一个报文段的第一个数据字节的序号。若确认号为NNN,则证明到序号N−1N-1N−1为止的所有数据都已正确收到。
- 数据偏移(首部长度):TCPTCPTCP报文段的数据起始处距离TCPTCPTCP报文段的起始处有多远,即TCPTCPTCP报头的长度。以4B4B4B位单位,即111个数值是4B4B4B,最大值为151515,达到TCPTCPTCP首部的最大值60B60B60B。
- 保留:目前为000。
还有六个控制位,除了PSHPSHPSH和RSTRSTRST位都较重要:
- 紧急位URGURGURG:URG=1URG=1URG=1时, 标明此报文段中有紧急数据,是高优先级的数据,应尽快传送,不用在缓存里排队。紧急数据都在数据报最前面,配合紧急指针字段使用,即数据从第一个字节到紧急指针所指字节之间的数据就是紧急数据。
- 确认位ACKACKACK:ACK=1ACK=1ACK=1时确认号有效,在连接建立后所有传送的报文段都必须把ACKACKACK置为111。
- 推送位PSHPSHPSH:PSH=1PSH=1PSH=1时,接收方尽快交付接收应用进程,不再等到缓存填满再向上交付。如果没有PSHPSHPSH,一般都是接收方缓存满了之后再将数据发送到主机。
- 复位RSTRSTRST:RST=1RST=1RST=1时, 表明TCPTCPTCP连接中出现严重差错,必须释放连接,然后再重新建立传输链接。
- 同步位SYNSYNSYN:SYN=1SYN=1SYN=1时,表明是一个连接请求/连接接受报文。此时若ACK=0ACK=0ACK=0代表这是一个连接请求报文,若ACK=1ACK=1ACK=1代表这是一个连接接收报文。
- 终止位FINFINFIN:FIN=1FIN=1FIN=1时,表明此报文段文送方数据已发完,要求释放连接。
- 窗口:指的是发送本报文段的一方的接收窗口,即现在允许对方还可以发送的数据量,防止对方发送过多数据导致自己无法接受。占2B2B2B,范围0∼216−10\sim2^{16}-10∼216−1。
- 检验和:检验首部+数据,检验时要加上12B12B12B伪首部,第四个的协议字段由171717改为666。
- 紧急指针: URG=1URG=1URG=1时才有意义,指出本报文段中数据部分的紧急数据的字节数。
- 选项:最大报文段长度MSSMSSMSS、窗口扩大、时间戳、选择确认……
- 填充:当首部长度不为444的整数倍就由填充部分填充000,到444字节的整数倍。
TCP协议连接管理
TCP建立连接采用客户服务器方式。但是实际上任何一台计算机都可能做服务器也可能做客户端。
TCP三次握手(建立连接)
![TCP建立连接][TCPbuildlink]
- 最开始客户端与服务端都是关闭状态。
- 服务器端创建传输控制块TCBTCBTCB,进入收听状态准备接受连接请求。
- 客户端创建TCPTCPTCP,发送请求连接报文段,无应用层数据。然后客户端进入同步已发送状态。
- 服务端接受报文段后进入同步收到状态,服务器端为该TCPTCPTCP连接分配缓存和变量,并向客户端返回确认报文段,允许连接,无应用层数据。
- 客户端接受报文后变成已建立连接状态,为该TCPTCPTCP连接分配缓存和变量,并向服务器端返回确认的确认,可以携带数据。
- 服务端接受到报文段后变成已建立连接状态。
注释:其中seqseqseq表示序号,指本报文的随机编号;ackackack表示确认号,指期待对方发送的报文的第一个序号。
若不指出为111,则代表其值为000。
- 第一部分:
- SYN=1SYN=1SYN=1:主机AAA要建立连接了。
- seq=xseq=xseq=x(随机):后面没有数据。
- 第二部分:
- SYN=1SYN=1SYN=1:主机BBB同意主机AAA建立连接。
- ACK=1ACK=1ACK=1:连接确认建立了,之后的ACKACKACK必须都置为111,表示开始同步。
- seq=yseq=yseq=y(随机):设置初始序号,后面没有数据。
- ack=x+1ack=x+1ack=x+1:表示期待对方放松的报文段的第一个字节,之前发送方AAA说发送的是第xxx位数据(虽然发送方是任意给出的),所以主机BBB要的是x+1x+1x+1位数据。
- 第三部分:
- ACK=1ACK=1ACK=1:连接建立了,之后的ACKACKACK必须都置为111。
- seq=x+1seq=x+1seq=x+1:主机AAA发送的报文段的第一个字节就是x+1x+1x+1。
- ack=y+1ack=y+1ack=y+1:之前接收方BBB发送的是第yyy位数据(虽然接收方是任意给出的),所以主机AAA要的是y+1y+1y+1位数,对其确认。
值得注意的是seqseqseq的值是随机的,所以客户端的和服务器端的序列值可能相同
SYN洪泛攻击
由于三次握手时服务器的资源在第二次握手时分配,客户端自愿者第三次握手时分配,可能导致反复确认与占用,产生SYNSYNSYN洪泛攻击。SYNSYNSYN洪泛攻击发生在OSIOSIOSI第四层。
这种方式利用TCPTCPTCP协议的特性,就是三次握手。攻击者发送TCPTCPTCP的SYNSYNSYN包,SYNSYNSYN是TCPTCPTCP三次握手中的第一个数据包,即第一步,而当服务器返回ACKACKACK后,该攻击者不对其进行再确认,那这个TCPTCPTCP连接就处于挂起状态,也就是所谓的半连接状态,服务器收不到再确认的话,还会重复发送ACKACKACK给攻击者。这样更加会浪费服务器的资源。攻击者对服务器发送非常大量的这种TCPTCPTCP连接,由于每一个都没法完成三次握手,所以在服务器上,这些TCPTCPTCP连接会因为挂起状态而消耗CPUCPUCPU和内存,最后服务器可能死机,就无法为正常用户提供服务了。可以通过设置SYN CookiesSYN\,CookiesSYNCookies来解决。
TCP四次挥手(连接释放)
每一条TCPTCPTCP连接的两个进程中的任何一个都能终止连接,连接结束后主机的资源将被释放。
![TCP释放连接][TCPreleaselink]
- 最开始客户端与服务端都是已建立连接状态。
- 客户端发送连接释放报文段,停止发送数据,主动关闭TCPTCPTCP连接,进入终止等待111状态。
- 服务端会回送一个确认报文段,此时服务器端进入关闭等待状态,客户到服务器这个方向的连接就释放了——半关闭的状态,不允许客户端再发送数据给服务器。
- 客户端接受报文段后进入终止等待222状态。
- 服务器发完数据,如果没有要向服务器发送的数据,就发出释放连接报文段,主动关闭TCPTCPTCP连接,进入最后确认阶段。
- 客户端回送一个确认报文字段,服务器端接收后进入关闭状态。客户端等到时间等待计时器设置的2MSL2MSL2MSL(最长报文段寿命)后彻底关闭连接,关闭服务器到客户这个方向,进入关闭状态。
注释:
- 第一部分:
- FIN=1FIN=1FIN=1:主机AAA要释放连接。
- seq=useq=useq=u(随机):后面可以有数据也可以没有数据。
- 第二部分:
- ACK=1ACK=1ACK=1:连接建立了,之后的ACKACKACK必须都置为111。
- seq=vseq=vseq=v(随机):v=u+v=u+v=u+第一部分数据长度+1+1+1,如果第一部分的确认报文没有数据就是v=u+1v=u+1v=u+1。
- ack=u+1ack=u+1ack=u+1:之前发送方AAA发送的是第uuu位数据,所以主机BBB要的是u+1u+1u+1位数据(尽管此时AAA已经决定释放连接了)。
- 第三部分:
- FIN=1FIN=1FIN=1:主机BBB要释放连接。
- ACK=1ACK=1ACK=1:连接建立了,之后的ACKACKACK必须都置为111。
- seq=wseq=wseq=w(随机):w=v+w=v+w=v+第二部分数据长度+1+1+1,如果第二部分的确认报文没有数据就是w=v+1w=v+1w=v+1。
- ack=u+1ack=u+1ack=u+1:之前发送方AAA说发送的是第uuu位数据,所以主机BBB要的是u+1u+1u+1位数据(因为A直接不发数据了,所以第二段第三段的ackackack都是u+1u+1u+1)。
- 第四部分:
- ACK=1ACK=1ACK=1:连接建立了,之后的ACKACKACK必须都置为111。
- seq=u+1seq=u+1seq=u+1:之前发的数据时第uuu位数据,BBB也要第u+1u+1u+1位数据,所以我发第u+1u+1u+1位数据。
- ack=w+1ack=w+1ack=w+1:之前发送方BBB说发送的是第www位数据,所以主机AAA要的是w+1w+1w+1位数据。
为什么要等待2MSL2MSL2MSL时间?
- 保证AAA发送的最后一个ACKACKACK报文段能发送到BBB,否则BBB服务器会接收不到AAA确认的信息,而AAA已经关闭无法重发确认报文段,从而BBB无法正常关闭。
- 防止已失效的连接请求报文段传输到下一次的连接请求,干扰下一次的连接服务。
TCP协议可靠传输
传输层使用的是GBNGBNGBN与SRSRSR的混合。
校验
通过校验的方式来保证数据一致,其方式也是如UDPUDPUDP校验一样增加伪首部与校验和。
序号
TCPTCPTCP报文传输时每个字节都会编上序号,一个字节占用一个序号,并按报文段的形式一起发送,报文段长度不定,根据MTUMTUMTU来定。
序号字段指一个报文段第一个字节的序号。
序号建立在传送的字节流上,而不是报文段。
虽然TCPTCPTCP面向字节,但是不是每个字节都要发回确认,而是在发送一个报文段后才发回一个确认,确认号为报文段第一个字节的序号,所以TCPTCPTCP是对报文段的确认机制。
确认
确认号是期望收到的下一个报文段数据的第一个字节的序号。
TCPTCPTCP缓存中的字节流按序传输后不会立刻在缓存中清除,而会等待接收方的确认字段,可以是单独确认也可以携带确认。
一般采用的是累计确认的方式。收到确认字段后就可以从缓存中清除对应报文段。
重传
一般有两种情况会产生重传:
超时:
- TCPTCPTCP每发送一个报文段就会设置一次计时器,TCPTCPTCP在重传时间内未收到确认就需要重传已发送的报文段。
- 由于TCPTCPTCP下层互联网环境复杂,每次路由选择可能变化从而带来时延方差也很大,所以采用自适应算法:
- 记录报文段发出时间和收到响应确认时间,称其差为报文段的往返时间RTTRTTRTT。
- 根据RTTRTTRTT的测量值动态改变重传时间RTTsRTT_sRTTs(加权平均往返时间)。
- 从而超时计时器设计的超时重传时间RTORTORTO应该略大于RTTSRTT_SRTTS。
新估计RTT=(1−α)×RTT=(1-\alpha)\timesRTT=(1−α)×旧RTT+α×RTT+\alpha\timesRTT+α×新RTTRTTRTT样本。
冗余ACKACKACK:
- 为了加快发现需要重传的报文段,可以采用冗余ACKACKACK(冗余确认/快重传),每当比期望序号大的失序报文段到达时,发送一个冗余ACKACKACK,指明下一个期待字节的序号。
- 如发送方已发送111,222,333,444,555报文段,接收方收到111会返回对111的确认(确认号为222的第一个字节),如果接收方收到333、444,都会返回对111的确认,发送方收到333个对于报文段111的冗余ACKACKACK就会认为222报文段丢失,从而快速重传222报文段。
TCP协议流量控制
TCPTCPTCP使用滑动窗口机制来完成流量控制,与数据链路层的滑动窗口类似。单位为字节。
在通信过程中,接收方会根据接收缓存的大小,动态调整发送方发送窗口的大小,即接收窗口rwndrwndrwnd(接受方设置确认报文段的窗口字段,将rwndrwndrwnd通知给发送方),发送方的发送窗口取接收窗口rwndrwndrwnd和拥塞窗口cwndcwndcwnd(根据当前网络拥塞程度而由发送发确定的窗口值,与网络带宽与时延相关)的最小值。
AAA向BBB发送数据,连接建立时,BBB告诉AAA:BBB的rwnd=400Brwnd=400Brwnd=400B,设每一个报文段100B100B100B,报文段序号初始值为111。
![TCP流量控制][TCPcurrent]
BBB只有处理完接收窗口中的数据才能继续接收AAA的数据,发送AAA一个rwndrwndrwnd不为000的报文。
而如果这个告诉AAA接收窗口rwndrwndrwnd不为000的报文丢失了,AAA就一直会等待发送,BBB就会一直等待接收,从而产生死锁般的情况。
TCPTCPTCP为每一个连接设有一个持续计时器,只要TCPTCPTCP连接的一方收到对方的零窗口通知(即rwnd=0rwnd=0rwnd=0的通知)就启动持续计时器。
如果计时器设置的时间到期,AAA就会发送一个零窗口探测报文段,接收方收到探测报文段就会给出现在的窗口值。
如果窗口仍然是000,那么发送方就重新设置持续计时器。
TCP协议拥塞控制
出现拥塞条件:需求>可用资源。
当网络中有许多资源同时呈现供应不足时网络性能变坏,网络吞吐量将随输入负荷增大而下降。
拥塞控制:防止过多的数据注入网络中。与流量控制不同的是它是面向全局的,是因为网络堵塞。形象来说拥塞控制就是为了控制路上堵车,而流量控制就是降低发车率。单位为MSSMSSMSS。
- 接收窗口rwndrwndrwnd指接收方能接收缓存设置的值,并告知给发送方,反映接收方容量。
- 拥塞窗口cwndcwndcwnd指发送方根据自己估算的网络拥塞程度而设置的窗口值,反映网络当前容量。
拥塞控制的假定:
- 数据单方向发送,而另一个方向只发送确认,而不会捎带确认。
- 接收方总是有足够大的缓存空间,因而发送窗口大小取决于拥塞程度。发送窗口=min\minmin(接收窗口rwndrwndrwnd,拥塞窗口cwndcwndcwnd)。
慢开始与拥塞避免
![慢开始与拥塞避免][congestavoid]
cwndcwndcwnd初始值是111,指一个最大报文段长度MSSMSSMSS。
传输轮次指发送了一批报文段并收到其确认的时间,一般指一个往返时延RTTRTTRTT。可能一次性传输多个报文。
- 最开始是慢开始算法,一步步试探网络拥塞,开始时以222的指数形式增长。
- ssthreshssthreshssthresh的意思是慢开始门限,代表从这个地方注入的报文段就比较多了,需要开始慢速增加了。
- 拥塞窗口超过慢开始门限后进行拥塞避免算法,之后一段都是线性增长,每次增加111,直至达到网络拥塞状态。
- 当网络开始拥塞时,进行乘法减小,瞬间将cwndcwndcwnd设置为111,同时调整原来的ssthreshssthreshssthresh的值到之前达到网络拥塞状态前值的1/21/21/2,(这里是242424降到121212),但是不能小于222。这样就能让拥塞的路由器能快速把队列中积压的分组处理完。
- 重复以上步骤,但是注意此时ssthreshssthreshssthresh变了之后线性增长的转折点也变了。所以最后拥塞窗口会波动逼近适合当前网络拥塞状态的窗口值。
注意:当慢开始进行指数增长时,当2cwnd>ssthresh2cwnd>ssthresh2cwnd>ssthresh时,则一个RTTRTTRTT后cwnd=ssthreshcwnd=ssthreshcwnd=ssthresh,不会让慢开始的拥塞窗口超过阈值。
快重传与快恢复
快重传(冗余ACKACKACK)在TCPTCPTCP协议可靠传输中已经提到过。
![快重传与快恢复][quickrepeat]
这里和上面的慢开始和拥塞避免的一开始步骤差不多,都是先指数增长再转变为线性增长。
不同的点是快重传和快恢复算法是在收到连续的ACKACKACK确认之后执行,这里的ACKACKACK就是冗余ACKACKACK,冗余ACKACKACK的特点是如果多次对某一段请求的数据没有被收到,达到一定数目,一般为三个冗余ACKACKACK之后就会立即执行重传。
但是此时只是降到现在cwndcwndcwnd的一半,再重新线性增长。而不是像慢开始和拥塞避免的从头开始,这就是快恢复。
一般而言TCPTCPTCP建立连接和网络超时时使用慢开始和拥塞避免算法;当发送方接收到冗余ACKACKACK时使用快重传和快恢复算法。