一、背景
TCP/IP中文译为传输控制协议/因特网互联协议。是当前流行的网络传输协议框架,从严格意义上讲它是一个协议族,因为TCP、IP是其中最核心的协议,所以把该协议族成为TPC/IP。
二、TCP /IP协议的分层框架
应用层:
应用层是我们经常接触使用的部分,比如常用的http协议、ftp协议(文件传输协议)、snmp(网络管理协议)、telnet (远程登录协议 )、smtp(简单邮件传输协议)、dns(域名解析),它的作用是传输层的数据到达应用层程序时,以某种统一规定的协议格式解读数据。
传输层:
传输层的作用就是在数据包通过网络发送到目标计算机后,应用程序在传输层定义逻辑端口,确认身份后,将数据包交给应用程序,实现端口到端口的通信。
tcp:面向连接(先要和对方确定连接、传输结束需要断开连接,类似打电话)、复杂可靠的、有很好的重传和查错机制。一般用与高速、可靠的通信服务
udp:面向无连接(无需确认对方是否存在,类似寄包裹)、简单高效、没有重传机制。一般用于即时通讯、广播通信等
网络层:
根据IP定义网络地址,区分网段。子网内根据地址解析协议(ARP)进行MAC寻址,子网外进行路由转化数据包,这个数据包就是IP数据包。
链路层:
数据链路层一般用来处理连接硬件的部分,包括控制网卡、硬件相关的设备驱动等。传输单位数据帧。
物理层:
物理层一般为负责数据传输的硬件,比如我们了解的双绞线电缆、无线、光纤等。比特流光电等信号发送接收数据。
总结一下,程序在发送消息时,应用层按既定的协议打包数据,随后传输层加上双方的端口号,由网络层加上双发的IP地址,由链路层加上双方的MAC地址,并将数据拆分成数据帧,经过多个路由器和网关后,到达目标机器。简而言之,就是按照“端口 ->IP地址->MAC地址” 这样的路径进行数据的封装和发送,解包的时候发过来操作即可。
三、TCP建立协议步骤(三次握手)
TCP的FLAG有6个bit组成:SYN(synchronous建立联机) ACK(acknowledgement 确认) PSH(push传送) FIN(finish结束) RST(reset重置) URG(urgent紧急)
Sequence number(顺序号码) Acknowledge number(确认号码)
第一次握手:主机A发送位码为syn=1,随机产生seq number=1234567的数据包到服务器,主机B由SYN=1知道,A要求建立联机;
第二次握手:主机B收到请求后要确认联机信息,向A发送ack number=(主机A的seq+1),syn=1,ack=1,随机产生seq=7654321的包
第三次握手:主机A收到后检查ack number是否正确,即第一次发送的seq number+1,以及位码ack是否为1,若正确,主机A会再发送ack number=(主机B的seq+1),ack=1,主机B收到后确认seq值与ack=1则连接建立成功。
完成三次握手,主机A与主机B开始传送数据
三次握手的意义在于需要确认一下信息:
open too many file
从编程的角度,TCP连接的建立是通过文件描述符完成的,通过创建套接字符获得一个fd,然后服务端和客户端需要基于所获得的fd调用不同的函数分别进入监听状态和发起连接请求,因为fd的数量将决定服务端进程所能建立的数量,对于大规模分布式服务来说,当fd不足时就会出现open too many file错误而使得无法建立更多的连接。
四、TCP断开连接(四次挥手)
由于TCP连接是全双工通信,双发都能作为数据的发送方和接收方,因此每个方向都必须单独进行关闭。这个原则是当一方完成它的数据发送任务后就能发送一个FIN来终止这个方向的连接。收到一个 FIN只意味着这一方向上没有数据流动,一个TCP连接在收到一个FIN后仍能发送数据。首先进行关闭的一方将执行主动关闭,而另一方执行被动关闭。
(1)客户端A发送一个FIN,用来关闭客户A到服务器B的数据传送(报文段4)。
(2)服务器B收到这个FIN,它发回一个ACK,确认序号为收到的序号加1(报文段5)。和SYN一样,一个FIN将占用一个序号。
(3)服务器B关闭与客户端A的连接,发送一个FIN给客户端A(报文段6)。
(4)客户端A发回ACK报文确认,并将确认序号设置为收到序号加1(报文段7)。
按照《码出高效》一书通俗的解释四次挥手可以这样描述:
男生:我们分手吧
女生:好的,我的东西收拾完,发短信给你(此时男生不能再拥抱女生了)
女生:我的东西收拾好了,分手吧(此时,女生也不能拥抱男生了)
男生:好的。(此时经过两个月的过渡期,双方才能找新的对象)
在这个过程中有两种状态值得注意CLOSE_WAIT和TIME_WAIT分别代表被动关闭和主动关闭产生的阶段性状态,如果线上服务器大量出现这两种状态,就会加重机器负载,也会影响有效的连接的创建,隐刺需要进行调优。
TIME_WAIT:即上面男生第二次说话之后的状态,表示主动要求关闭的机器表示收到了对方FIN的报文,并发送了ACK报文,进入了TIME_WAIT状态,等2msl后即可进入到CLOSED状态。
CLOSE_WAIT:即上面女生第一次说完之后的状态,表示被动要求关闭的机器收到对方请求关闭连接的FIN报文在第一次ack应答之后,马上进入CLOSE_WAIT状态。这种状态其实表示在等待关闭,并通知应用程序发送剩余数据,处理县城信息,关闭相关资源。
TIME_WAIT是挥手四次断开连接的尾声,如果此状态连接过多,则可以通过优化服务器参数得到解决(time_wait后等待的时间调小),大马上就哦CLOSE_WAIT过多很可能是程序自身的问题,比如在对方关闭连接后,程序没有检测到,或者自己忘记关闭连接,例如程序处理完业务逻辑后没有释放流操作,但程序一致运行正常,等到大量触发该业务逻辑是,就会导致生产事故的发生。
总结:
1.为什么建立连接协议是三次握手,而关闭连接却是四次握手呢?
这是因为服务端的LISTEN状态下的SOCKET当收到SYN报文的建连请求后,它可以把ACK和SYN(ACK起应答作用,而SYN起同步作用)放在一个报文里来发送。但关闭连接时,当收到对方的FIN报文通知时,它仅仅表示对方没有数据发送给你了;但未必你所有的数据都全部发送给对方了,所以你可以未必会马上会关闭SOCKET,也即你可能还需要发送一些数据给对方之后,再发送FIN报文给对方来表示你同意现在可以关闭连接了,所以它这里的ACK报文和FIN报文多数情况下都是分开发送的.
2.为什么TIME_WAIT状态还需要等2MSL后才能返回到CLOSED状态?
这是因为虽然双方都同意关闭连接了,而且握手的4个报文也都协调和发送完毕,按理可以直接回到CLOSED状态(就好比从SYN_SEND状态到ESTABLISH状态那样);但是因为我们必须要假想网络是不可靠的,你无法保证你最后发送的ACK报文会一定被对方收到,因此对方处于LAST_ACK状态下的SOCKET可能会因为超时未收到ACK报文,而重发FIN报文,所以这个TIME_WAIT状态的作用就是用来重发可能丢失的ACK报文。