自定义模块的查找方式

在介绍自定义模块的查找方式之前,需要先介绍一下模块路径这个概念。


模块路径是Node在定位文件模块的具体文件时制定的查找策略,具体表现为一个路径组成的数组。


生成路径


创建module_path.js文件,

其内容为 console.log(module.paths)

将其放到任意一个目录中然后执行 node module_path.js 


在Linux下,你可能得到的是这样一个数组输出:

[ '/home/jackson/research/node_modules',

'/home/jackson/node_modules',

'/home/node_modules',

'/node_modules' ]


当前文件目录下的node_modules目录。

父目录下的node_modules目录。

父目录的父目录下的node_modules目录。

沿路径向上逐级递归,直到根目录下的node_modules目录。


它的生成方式与JavaScript的原型链或作用域链的查找方式十分类似。在加载的过程中,Node会逐个尝试模块路径中的路径,直到找到目标文件为止。可以看出,当前文件的路径越深,模块查找耗时会越多,这是自定义模块的加载速度是最慢的原因。



定位文件


但在文件的定位过程中,还有一些细节需要注意,这主要包括文件扩展名的分析、目录和包的处理。


文件扩展名分析


require() 在分析标识符的过程中,会出现标识符中不包含文件扩展名的情况。CommonJS模块规范也允许在标识符中不包含文件扩展名,这种情况下,Node会按.js、.json、.node的次序补足扩展名,依次尝试。


在尝试的过程中,需要调用 fs 模块同步阻塞式地判断文件是否存在。因为Node是单线程的,所以这里是一个会引起性能问题的地方。小诀窍是:如果是.node和.json文件,在传递给 require() 的标识符中带上扩展名,会加快一点速度。另一个诀窍是:同步配合缓存,可以大幅度缓解Node单线程中阻塞式调用的缺陷。


目录分析和包


在分析标识符的过程中, require() 通过分析文件扩展名之后,可能没有查找到对应文件,但却得到一个目录,这在引入自定义模块和逐个模块路径进行查找时经常会出现,此时Node会将目录当做一个包来处理。


在这个过程中,Node对CommonJS包规范进行了一定程度的支持。首先,Node在当前目录下查找package.json(CommonJS包规范定义的包描述文件),通过 JSON.parse()解析出包描述对象,从中取出 main属性指定的文件名进行定位。如果文件名缺少扩展名,将会进入扩展名分析的步骤。


而如果 main 属性指定的文件名错误,或者压根没有package.json文件,Node会将 index 当做默认文件名,然后依次查找index.js、index.node、index.json。


如果在目录分析的过程中没有定位成功任何文件,则自定义模块进入下一个模块路径进行查找。如果模块路径数组都被遍历完毕,依然没有查找到目标文件,则会抛出查找失败的异常。


自定义模块的查找方式