文件描述符表,打开文件表,索引节点表

1. 概述
    在Linux系统中一切皆可以看成是文件,文件又可分为:普通文件、目录文件、链接文件和设备文件。文件描述符(file descriptor)是内核为了高效管理已被打开的文件所创建的索引,其是一个非负整数(通常是小整数),用于指代被打开的文件,所有执行I/O操作的系统调用都通过文件描述符。程序刚刚启动的时候,0是标准输入,1是标准输出,2是标准错误。如果此时去打开一个新的文件,它的文件描述符会是3。POSIX标准要求每次打开文件时(含socket)必须使用当前进程中最小可用的文件描述符号码,因此,在网络通信过程中稍不注意就有可能造成串话。标准文件描述符图如下:
文件描述符表,打开文件表,索引节点表

文件描述与打开的文件对应模型如下图:
文件描述符表,打开文件表,索引节点表

2. 文件描述限制
    在编写文件操作的或者网络通信的软件时,初学者一般可能会遇到“Too many open files”的问题。这主要是因为文件描述符是系统的一个重要资源,虽然说系统内存有多少就可以打开多少的文件描述符,但是在实际实现过程中内核是会做相应的处理的,一般最大打开文件数会是系统内存的10%(以KB来计算)(称之为系统级限制),查看系统级别的最大打开文件数可以使用sysctl -a | grep fs.file-max命令查看。与此同时,内核为了不让某一个进程消耗掉所有的文件资源,其也会对单个进程最大打开文件数做默认值处理(称之为用户级限制),默认值一般是1024,使用ulimit -n命令可以查看。在Web服务器中,通过更改系统默认值文件描述符的最大值来优化服务器是最常见的方式之一,具体优化方式请查看http://blog.csdn.net/kumu_linux/article/details/7877770
3.三者之间的关系
  1)(进程级)描述符表 : 进程每次打开一个文件,系统就会在该进程的用户文件描述符表中分配一个相应的表项,表项的索引返回给该进程,用于标志该文件,找个索引就是常说的文件描述符。每个进程都有它独立的描述符表。
  2)  打开文件表(又叫做系统级的描述符表) : 表格中各条目称为打开文件句柄(open file handle)。一个打开文件句柄存储了与一个打开文件相关的全部信息,如下所示:
    1. 当前文件偏移量(调用read()和write()时更新,或使用lseek()直接修改)
    2. 打开文件时所使用的状态标识(即,open()的flags参数)
    3. 文件访问模式(如调用open()时所设置的只读模式、只写模式或读写模式)
    4. 与信号驱动相关的设置
    5. 对该文件i-node对象的引用
    6. 文件类型(例如:常规文件、套接字或FIFO)和访问权限
    7. 一个指针,指向该文件所持有的锁列表
    8. 文件的各种属性,包括文件大小以及与不同类型操作相关的时间戳
所有的进程共享这张表.每个文件表的表项组成包括有当前的文件位置,引用计数(当前)指向该表项的描述符项数,以及一个指向v-node表中对应表项的指针。关闭一个描述符会减少相应的文件表项中的引用计数。内核不会删除这个文件表表项,直到它的引用计数为零。
  3)v-node表 : 同文件表一样,所有的进程共享这张v-node表。每个表项包含stat结构中的大多数信息,包括st_mode和st_size成员.
文件描述符表,打开文件表,索引节点表

 下图是一个实例,其中描述符1和4通过不同的打开文件表表项来引用两个不同的文件,这是一种典型的情况,没有文件共享,并且每个描述符对应一个不同的文件:

文件描述符表,打开文件表,索引节点表

      多个描述符也可以通过不同的文件表表项来引用同一个文件。例如,如果以同一个文件名调用open函数2次,就会发生这种情况。关键思想是每个文件描述符都有它自己的文件位置,所以不同描述符的读操作可以从文件的不同位置获取数据:

文件描述符表,打开文件表,索引节点表

文件描述符表,打开文件表,索引节点表




参考链接:
http://canbeatle.iteye.com/blog/891319
http://blog.csdn.net/cywosp/article/details/38965239