在Kafka中,体现ZeroCopy使用场景的地方有两处:基于mmap的索引和日志文件读写所用的TransportLayer。
mmap的索引
索引都是基于MappedByteBuffer的,也就是让用户态和内核态共享内核态的数据缓冲区,此时,数据不需要复制到用户态空间。不过,mmap虽然避免了不必要的拷贝,但是不一定就能保证很高的性能,在不同的操作系统下,mmap的创建和销毁成本可能是不一样的。很高的创建和销毁开销会抵消ZeroCopy带来的性能优势。由于这种不确定性,在Kafka中,只有索引应用了最核心的日志并未使用mmap机制。
TransportLayer
TransportLayer是kafka传输层的接口,它的某个实现类使用FileChannel的TransferTo方法。该方法底层使用sendfiIe实现了ZeroCOpy,对Kafka而言,如果I/0通道使用普通的PLA1NTEXT,那么,Kafka就可以利用ZeroCopy特性直接将页缓存中的数据发送到网卡的Buffer中,避免了中间的多次拷贝。相反,如果通道启用了SSL,那么,Kafka便无法利用ZeroCOpy。
博客介绍了Kafka中ZeroCopy的两处使用场景。一是基于mmap的索引,通过MappedByteBuffer让用户态和内核态共享数据缓冲区,但mmap创建和销毁成本在不同系统有差异,Kafka仅索引应用该机制。二是TransportLayer,其实现类用FileChannel的TransferTo方法实现ZeroCopy,普通通道可利用此特性,启用SSL则无法利用。
1203





