Linux I/O 模型

5 种 I/O 模型：

阻塞式 I/O

非阻塞式 I/O

I/O 复用（select，poll，epoll等）

信号驱动式 I/O（SIGIO）

异步 I/O（POSIX 的 aio_ 系列函数）

I/O 执行的两个阶段

在Linux中，对于一次读取 IO 的操作，数据并不会直接拷贝到程序的程序缓冲区。通常包括两个不同阶段：

等待数据准备好，到达内核缓冲区。
从内核向进程复制数据。

网络IO的本质是socket的读取，socket在linux系统被抽象为流，IO可以理解为对流的操作。对于一个套接字上的输入操作：

等待数据从网络中到达。当所有等待分组到达时，它被复制到内核中的某个缓冲区。
把数据从内核缓冲区复制到应用程序缓冲区。

阻塞式 I/O

同步阻塞 IO 模型是最常用、最简单的模型。在 Linux 中，默认情况下，所有套接字都是阻塞的。下面以阻塞套接字的 recvfrom 的的调用图来说明阻塞：

Linux I/O 模型

进程调用一个 recvfrom 请求，但是它不能立刻收到回复，直到数据返回，然后将数据从内核空间复制到程序空间才得到回复。

在 IO 执行的两个阶段中，进程都处于 blocked(阻塞) 状态，在等待数据返回的过程中不能做其他的工作，只能阻塞地等在那里。

优缺点

优点是简单，实时性高，响应及时无延时。
缺点也很明显，需要阻塞等待，性能差。

非阻塞式 I/O

与阻塞式I/O不同的是，非阻塞的 recvform 系统调用调用之后，进程并没有被阻塞，内核马上返回给进程，如果数据还没准备好，此时会返回一个 error（EAGAIN 或 EWOULDBLOCK）。进程在返回之后，可以处理其他的业务逻辑，过会儿再发起 recvform 系统调用。重复上面的过程，循环往复的进行recvform系统调用。这个过程通常被称之为轮询。采用轮询的方式检查内核数据，直到数据准备好。再拷贝数据到进程，进行数据处理。需要注意，拷贝数据整个过程，进程仍然是阻塞的状态。

在 linux 下，可以通过设置 socket 套接字选项使其变为非阻塞。下图是非阻塞的套接字的 recvfrom 操作：

Linux I/O 模型

如上图，前 3 次调用 recvfrom 请求，但是并没有数据返回，所以内核返回errno(EWOULDBLOCK)，并不会阻塞进程。但是当第 4 次调用 recvfrom，数据已经准备好了，然后将它从内核空间拷贝到程序空间，处理数据。

在非阻塞状态下，IO 执行的等待阶段并不是完全的阻塞的，但是第 2 个阶段依然处于一个阻塞状态。

优缺点

优点：
- 能在等待任务完成的时间里干其他活（包括提交其他任务，也就是 “后台” 可以有多个任务在同时执行）。
缺点：
- 任务完成的响应延迟增大，因为每过一段时间才去轮询一次 read 操作，而任务可能在两次轮询之间的任意时间完成。这会导致整体数据吞吐量的降低。
- 需要不断主动轮询，轮询占据了很大一部分过程，轮询会消耗大量的 CPU 时间。

高并发的程序一般使用同步非阻塞方式而非多线程 + 同步阻塞方式。要理解这一点，首先要扯到并发和并行的区别。通过合理调度任务的不同阶段，并发数可以远远大于并行度，这就是区区几个 CPU 可以支持上万个用户并发请求的奥秘。在这种高并发的情况下，为每个任务（用户请求）创建一个进程或线程的开销非常大。而同步非阻塞方式可以把多个 IO 请求丢到后台去，这就可以在一个进程里服务大量的并发 IO 请求。（不是很明白，是指创建进程或线程来监听文件是否准备好么）

I/O 多路复用

后台可能有多个任务在同时进行，人们就想到了循环查询多个任务的完成状态，只要有任何一个任务完成，就去处理它。

I/O复用模型会用到select、poll、epoll函数，这几个函数也会使进程阻塞，但是和阻塞I/O所不同的的，这两个函数可以同时阻塞多个I/O操作。而且可以同时对多个读操作，多个写操作的I/O函数进行检测，直到有数据可读或可写时（注意不是全部数据可读或可写），才真正调用I/O操作函数。

对于多路复用，也就是轮询多个socket。多路复用既然可以处理多个IO，也就带来了新的问题，多个IO之间的顺序变得不确定了。

IO 多路复用（select，poll，epol）的好处就在于单个进程就可以同时处理多个网络连接的 IO。它的基本原理就是不再由应用程序自己监视连接，取而代之由内核替应用程序监视文件描述符。select，poll，epoll 这些 function 会不断的轮询所负责的所有 socket，当某个 socket 有数据到达了，就通知用户进程。

以 select 为例，当用户进程调用了 select，那么整个进程会被阻塞，而同时，kernel 会“监视”所有 select 负责的 socket，当任何一个 socket 中的数据准备好了，select 就会返回。这个时候用户进程再调用 read 操作，将数据从内核拷贝到用户进程。如图：

Linux I/O 模型

这里需要使用两个 system call (select 和 recvfrom)，而阻塞 IO只调用了一个 system call (recvfrom)。所以，如果处理的连接数不是很高的话，使用 IO 复用的服务器并不一定比使用多线程 + 非阻塞/阻塞 IO 的性能更好，可能延迟还更大。IO 复用的优势并不是对于单个连接能处理得更快，而是单个进程就可以同时处理多个网络连接的 IO。

实际使用时，对于每一个socket，都可以设置为非阻塞。但是，如上图所示，整个用户的进程其实是一直被阻塞的。只不过进程是被 select 这个函数阻塞，而不是被 IO 操作给阻塞。所以 IO 多路复用是阻塞在 select，epoll 这样的系统调用之上，而没有阻塞在真正的 I/O 系统调用（如recvfrom）。

IO多路复用在阻塞到 select 阶段时，用户进程是主动等待并调用select函数获取数据就绪状态消息，并且其进程状态为阻塞。所以，把 IO 多路复用归为同步阻塞模式。

优点

与传统的多线程/多进程模型比，I/O 多路复用的最大优势是系统开销小，系统不需要创建新的额外进程或者线程，也不需要维护这些进程和线程的运行，降底了系统的维护工作量，节省了系统资源。

应用场景

服务器需要同时处理多个处于监听状态或者多个连接状态的套接字；
服务器需要同时处理多种网络协议的套接字，如同时处理 TCP 和 UDP 请求；
服务器需要监听多个端口或处理多种服务；
服务器需要同时处理用户输入和网络连接。

信号驱动式 I/O

允许 Socket 进行信号驱动 IO,并注册一个信号处理函数，进程继续运行并不阻塞。当数据准备好时，进程会收到一个SIGIO信号，可以在信号处理函数中调用I/O操作函数处理数据。阻塞在 IO 操作的第二阶段。

如下图：

Linux I/O 模型

异步 I/O

上述四种 IO 模型都是同步的。从整个 IO 过程来看，他们都是顺序执行的，因此可以归为同步模型(synchronous)。都是进程主动等待且向内核检查状态。

相对于同步 IO，异步 IO 不是顺序执行。用户进程进行 aio_read 系统调用之后，就可以去处理其他的逻辑了，无论内核数据是否准备好，都会直接返回给用户进程，不会对进程造成阻塞。等到数据准备好了，内核直接复制数据到进程空间，然后从内核向进程发送通知，此时数据已经在用户空间了,可以对数据进行处理了。IO 两个阶段，进程都是非阻塞的。

在 Linux 中，通知的方式是 “信号”，分为 3 种情况：

如果这个进程正在用户态处理其他逻辑，那就强行打断，调用事先注册的信号处理函数，这个函数可以决定何时以及如何处理这个异步任务。由于信号处理函数是突然闯进来的，因此跟中断处理程序一样，有很多事情是不能做的，因此保险起见，一般是把事件 “登记” 一下放进队列，然后返回该进程原来在做的事。
如果这个进程正在内核态处理，例如以同步阻塞方式读写磁盘，那就把这个通知挂起来了，等到内核态的事情忙完了，快要回到用户态的时候，再触发信号通知。
如果这个进程现在被挂起了，例如陷入睡眠，那就把这个进程唤醒，等待 CPU 调度，触发信号通知。

Linux I/O 模型

I/O 模型比较

blocking 和 non-blocking 区别

调用 blocking IO 会一直 block 住对应的进程直到操作完成，而 non-blocking IO 在 kernel 准备数据的情况下会立刻返回。

synchronous IO 和 asynchronous IO区别

在说明synchronous IO和asynchronous IO的区别之前，需要先给出两者的定义。POSIX的定义是这样子的：

A synchronous I/O operation causes the requesting process to be blocked until that I/O operation completes;

An asynchronous I/O operation does not cause the requesting process to be blocked;

两者的区别就在于 synchronous IO 做”IO operation” 的时候会将 process 阻塞。按照这个定义，之前所述的blocking IO，non-blocking IO，IO multiplexing 都属于 synchronous IO。

有人会说，non-blocking IO并没有被 block 啊。这里有个非常“狡猾”的地方，定义中所指的”IO operation”是指真实的 IO 操作，就是例子中的 recvfrom 这个 system call。non-blocking IO 在执行 recvfrom 这个system call的时候，如果kernel的数据没有准备好，这时候不会block进程。但是，当kernel中数据准备好的时候，recvfrom 会将数据从 kernel 拷贝到用户内存中，这个时候进程是被block了，在这段时间内，进程是被 block 的。

而 asynchronous IO 则不一样，当进程发起 IO 操作之后，就直接返回再也不理睬了，直到 kernel 发送一个信号，告诉进程说 IO 完成。在这整个过程中，进程完全没有被 block。

Linux I/O 模型

前 4 种 I/O 模型都是同步 I/O 操作，它们的区别在于第一阶段，而第二阶段是一样的：在数据从内核复制到应用缓冲区期间（用户空间），进程阻塞于 recvfrom 调用。

通过上面的图片，可以发现 non-blocking IO 和 asynchronous IO 的区别还是很明显的。在 non-blocking IO 中，虽然进程大部分时间都不会被 block，但是它仍然要求进程去主动的 check，并且当数据准备完成以后，也需要进程主动的再次调用 recvfrom 来将数据拷贝到用户内存。而 asynchronous IO 则完全不同。它就像是用户进程将整个IO操作交给了 kernel 完成，然后做完后发信号通知。在此期间，用户进程不需要去检查IO操作的状态，也不需要主动的去拷贝数据。

I/O 执行的两个阶段

阻塞式 I/O

非阻塞式 I/O

I/O 多路复用

信号驱动式 I/O

异步 I/O

I/O 模型比较

相关推荐