NIO与零拷贝

1. 零拷贝的基本介绍

  • 零拷贝是网络编程的关键,很多性能的优化都离不开。
  • 在Java程序中,常用的零拷贝有mmap(内存映射)喝sendFile。

2. 传统的IO模型与零拷贝对比

2.1 传统的模型图

NIO与零拷贝

其中 DMA: direct memory access 直接内存拷贝(不适用CPU)

2.2 mmap 优化

  • mmap示意图
    NIO与零拷贝
    mmap 通过内存映射,将文件映射到内核缓冲区,同时,用户空间可以共享内核空间的数据。这样在进行网络传输的时候,就可以减少内核空间到用户空间的拷贝次数。

2.3 sendFile 优化

  • 示意图
    NIO与零拷贝
    Linux2.1 版本提供了sendFile函数,其原理是:数据根本不经过用户态,直接从内核缓冲区进入到Socket Buffer ,同时,由于和用户态完全无关,就减少了上下文切换。
  • 提示
    零拷贝从操作系统的角度就是没有CPU拷贝。
  • Linux在2.4的版本中做了修改,避免从内核缓冲区拷贝到Socket buffer的操作,直接拷贝到协议栈,从而再一次减少了数据拷贝。如下图:
    NIO与零拷贝
    这里其实有一次CPU拷贝,kernel buffer->socket buffer,但是拷贝的信息很少,比如length ,offset, 消耗低,可以忽略。

2.4 mmap 和 sendFile 的区别

  • mmap 适合小数据读写,sendFile适合大文件的读写。
  • mmap需要4此上下文切换,3次数据拷贝;sendFile需要3次上下文切换,最少2次数据拷贝。
  • sendFile 可以通过DMA方式,减少CPU拷贝,mmap则不能(必须从内核拷贝到Socket缓冲区)。

2.5 零拷贝的再次理解

  • 零拷贝是从操作系统的角度来说的,因为内核缓冲区之间,没有数据是重复的(只有kernel buffer 有一份数据)
  • 零拷贝不仅仅带来更少的数据复制,还能带来其他性能优势,例如更少的上下文切换,更少的CPU缓存伪共享以及无CPU校验和计算。