网路基础 — 浅析I/O多路转接之poll技术
浅析I/O多路转接之poll技术
————————————————————————————
函数的基本用法,我们也看到了其实select服务器还是很多问题的,在历史的长河当中它的性能问题在用户体验上的影响会越来越大,
这个时候终于有人受不了了,可能是它需要同时监视超过1024个文件描述符,又或者它觉得代码太难编写了需要一遍一遍的遍历,所以
决定自己写一个另外一种系统调用函数来提升性能,这个时候poll出现在我们的面前。我们来看看他如何解决select问题呢?
poll函数
不同于select使用三个位图来表示三种fdset,poll他就是使用一个pollfd结构体来表示这些.
我们首先把重点放到那些红线里面,这里是POLL函数提高效率的一个关键,我们逐一来注意一下该结构体的内容.首先fd就不用说什么
,也就是我们的sock文件描述符,这里最关键的就是下面两个,因为fd上面需要关心的时事件都存在events里面而revents就是用来存
放实际发生了那些事件用来返回的.
events可以表示合法的事件如下:
事件 | 描述 |
---|---|
POLLIN | 有数据可读 |
POLLRDNORM | 有普通数据可读 |
POLLRDBAND | 有优先数据可读。 |
POLLPRI | 有紧迫数据可读。 |
POLLOUT | 写数据不会导致阻塞 |
POLLWRNORM | 写普通数据不会导致阻塞 |
POLLWRBAND | 写优先数据不会导致阻塞 |
POLLMSGSIGPOLL | 消息可用。 |
除了上面,revents域中还可能返回下列事件:
事件 | 描述 |
---|---|
POLLER | 指定的文件描述符发生错误 |
POLLHUP | 指定的文件描述符挂起事件 |
POLLNVAL | 指定的文件描述符非法 |
这些事件在events域中无意义,因为它们在合适的时候总是会从revents中返回。
其实这里我们就可以看到poll函数较与select函数的优点在哪里,因为如果你是select函数,在调用完之后,select()函数会清空它
的文件描述符fd指定的关心的事件(也就是清空位图),这些在下次都得遍历来重新定义.也就是又遍历一遍fd集合.POLL函数:fds:
是一个struct pollfd结构类型的数组,用于存放需要检测其状态的Socket描述符;每当调用这个函数之后,系统不会清空这个数组,
操作起来比较方便;特别是对于socket连接比较多的情况下,在一定程度上可以提高处理的效率;这一点与select()函数不同,调用
select()函数之后,select()函数会清空它所检测的socket描述符集合,导致每次调用select()之前都必须把socket描述符重新加
入到待检测的集合中;因此,select()函数适合于只检测一个socket描述符的情况,而
poll()函数适合于大量socket描述符的情况;
nfds
nfds_t类型的参数,用于标记数组fds中的结构体元素的总数量;
timeout:
timeout 为 -1
这会造成 poll 永远等待。poll() 只有在一个描述符就绪时返回,或者在调用进程捕捉到信号时返回(在这里,poll返回 -1),并且
这会造成 poll 永远等待。poll() 只有在一个描述符就绪时返回,或者在调用进程捕捉到信号时返回(在这里,poll返回 -1),并且
设置 errno 值为 EINTR 。-1 可以用宏定义常量 INFTIM 来代替(在 pth.h 中有定义) 。
timeout 等于0
在这种情况下,测试所有的描述符,并且 poll() 立刻返回。这允许在 poll 中没有阻塞的情况下找出多个文件描述符的状态。
time > 0
这将以毫秒为单位指定 timeout 的超时周期。poll() 只有在超时到期时返回,除非一个描述符变为就绪,在这种情况下,它立刻
返回如果超时周期到齐,poll() 返回 0。这里也可能会因为某个信号而中断该等待。和 select 一样,文件描述符是否阻塞对
poll 是否阻塞没有任何影响.其实我们应该已经看出来poll服务器的优势了吧~ 它首先相对于select服务来说,提升了性能它用
pollfd结构体,防止了程序里面嵌套的各种各样繁琐循环,以及呢select服务器它最大可以同时监视的文件描述符是一个定长的,
而poll改变了这个因为它是由用户输入的长度,你输入多少那么我就给你多少个pollfd结构体,这样有问题也不关我函数的事情,
使用户自己使用出现问题. 是不是感觉poll完美了?无敌了? 其实我们应该冷静下来,再想想为什么当前基本都在使用最广泛
的是epoll服务器而不是poll? 如果poll这么无坚不摧的他为什么会被epoll取代?
思考一下poll服务器在怎么样的应用场景下,就会出现问题?
select和poll都需要在返回后,通过遍历文件描述符来获取已经就绪的socket,这样想如果你可以表示的文件描述符超级超级的多
,这时候有人攻击你,让你的服务器短时间内产生大量的用户,因为每次返回后都需要遍历文件描述符来获取已经就绪的socket,
这时候如果用户足够的多,别人给你创建了骚起来创建用户,让你返回每次遍历的时候拥有接近死循环的遍历长度,这时候poll
服务器何谈性能而言? 其实如果不解决通过遍历查找就绪的文件描述符这种形式你的服务器其实就是相对不安全,而且就算是没有
人攻击你,比如像双11这种购物节,如果马云使用的poll服务器那么,服务器可能骚起来挂,马云心态就该崩了.
所以呢,因为poll也是在返回后,通过遍历文件描述符来获取已经就绪的socket,事实上,在连接的大量的客户端在某一时刻他们之
间就绪的客户端通常不会很多,因为随着文件描述符的增多,poll的效率也会成线性下降.这个时候就出现了poll的升级版本epoll,
它真的可以完美解决掉一切select和poll所遇到的问题,而且技术很成熟很稳定效率很高,当今拥有最好的I/O就绪通知方法,在
下一个博客我会详细的说明他底层的实现原理.