在Kafka中,体现ZeroCopy使用场景的地方有两处:基于mmap的索引和日志文件读写所用的TransportLayer。
mmap的索引
索引都是基于MappedByteBuffer的,也就是让用户态和内核态共享内核态的数据缓冲区,此时,数据不需要复制到用户态空间。不过,mmap虽然避免了不必要的拷贝,但是不一定就能保证很高的性能,在不同的操作系统下,mmap的创建和销毁成本可能是不一样的。很高的创建和销毁开销会抵消ZeroCopy带来的性能优势。由于这种不确定性,在Kafka中,只有索引应用了最核心的日志并未使用mmap机制。
TransportLayer
TransportLayer是kafka传输层的接口,它的某个实现类使用FileChannel的TransferTo方法。该方法底层使用sendfiIe实现了ZeroCOpy,对Kafka而言,如果I/0通道使用普通的PLA1NTEXT,那么,Kafka就可以利用ZeroCopy特性直接将页缓存中的数据发送到网卡的Buffer中,避免了中间的多次拷贝。相反,如果通道启用了SSL,那么,Kafka便无法利用ZeroCOpy。