TCP粘包/拆包问题解决之道
上一章
上一章介绍了Netty的入门应用:
Netty权威指南(三)Netty入门应用
一、介绍
熟悉TCP编程的读者可能都知道,无论是服务端还是客户端,当我们读取或者发送消息的时候,都需要考虑TCP底层的粘包/拆包机制。
TCP是个流
的协议,所谓流
就是没有界限的一串数据,大家可以想想河里的水,他们是连成一片的,其间并没有分界线。TCP底层并不了解上层业务数据的具体含义,它会根据TCP缓冲区的实际情况进行包的划分。所以在业务上认为,一个完整的包可能会被TCP拆分成多个包进行发送,也可能会把多个小的包封装成一个大的数据包发送,这就是所谓的TCP粘包/拆包问题。
1.1 TCP粘包/拆包问题说明
假设客户端分别发送了两个数据包D1和D2给服务端,由于服务端一次读取到的字节数不是确定的,故可能存在四种情况:
- 服务端分两次读取到两个独立的包,分别是D1和D2,没有粘包和拆包。
- 服务端一次接受到两个数据包,D1和D1粘合在一起,被称为TCP粘包。
- 服务端分两次接收到了两个数据包,第一次读取到了完成的D1包和D2包的部分内容,第二次读取到了D2包的剩余内容,这被称为TCP的拆包。
- 服务端分两次接受到了两个数据包,第一次读取到了D1包的部分内容D1-1,第二次读取到了D1包的剩余内容D1-2和D2包的整包。
如果此时服务端TCP接收滑窗非常小,而数据包D1和D2比较大,很有可能会发生第五中可能 ,即服务端分多次才能将D1和D2包完全接收,期间发生多次拆包。
1.2 TCP粘包/拆包发生的原因
- 应用程序write写入的字节大小大于套接字发送缓冲区大小。
- 进行MSS大小的TCP分段。
- 以太网帧的payload大于MTU进行IP分段。
1.3 粘包问题的解决策略
由于底层的TCP无法理解业务上层的业务数据,所以在地城无法保证数据包不被拆分和重组。这个问题只能通过上层的应用协议栈设计来解决,根据业界的主流协议的解决方案,可以归纳如下:
- 消息定长,例如每个报文的大小为固定长度200字节,如果不够,空位补空格。
- 在包尾增加回车换行符进行分割,例如FTP协议。
- 将消息分为消息头和消息体,消息头中包含表示消息总长度(或者消息体长度)的字段,通常设计思路为消息头的第一个字段使用int32来表示消息的总长度。
- 更复杂的应用层协议。
下面我们就通过实际案例来看看如何使用Netty提供的半包解码器来解决TCP粘包/拆包问题。
二、未考虑TCP粘包导致的功能异常案例
2.1 TimeServerHandler的改造
package com.lsh.netty;
import io.netty.buffer.ByteBuf;
import io.netty.buffer.Unpooled;
import io.netty.channel.ChannelHandlerAdapter;
import io.netty.channel.ChannelHandlerContext;
import java.io.UnsupportedEncodingException;
import java.util.Date;
/**
* @author :LiuShihao
* @date :Created in 2021/3/8 12:39 下午
* @desc :未考虑TCP粘包导致的功能异常案例
*/
public class TimeServerHandler extends ChannelHandlerAdapter {
private int counter;
@Override
public void channelRead(ChannelHandlerContext ctx, Object msg) throws UnsupportedEncodingException {
ByteBuf buf = (ByteBuf)