在nodejs中引入模块需要经历如下3个步骤
1.路径分析
2.文件定位
3.编译执行
在nodejs中模块分为两类,一类是nodejs提供的模块,称为核心模块,另一类的用户编写的模块,称为文件模块。
1.核心模块在nodejs源代码的编译过程中,编译进了二进制执行文件,在nodejs进程启动时,部分核心模块就被直接加载进内存够中 ,这部分核心模块引入时,文件定位和编译执行两个步骤可以省略,并且在路径分析中优先判断,所以它的加载速度时最快的。
2.文件模块则是在运行时动态加载,需要完整的路径分析,文件定位,编译执行过程,速度比核心模块慢。
一.优先从缓存中加载
为了减少二次引入的开销,nodejs会对引入过的模块进行缓存,缓存的是编译和执行之后的对象。不论是核心模块还是文件模块,require()方法对相同模块的二次加载都一律采用缓存优先的方式。不同之处在于核心模块的缓存检查优先于文件模块的缓存检查。
二.路径分析
在nodejs中使用require()引入文件时,require()方法接受一个标识符作为参数。nodejs就是通过这个标识符进行模块查找的。模块标识符只要分为如下几类:
1.核心模块,如http,fs,path等
2. .或..开始的相对路径文件模块
3.以/开始的绝对路径文件模块
4.非路径形式的文件模块,如自定义的connect模块
2.1.核心模块
核心模块的优先级仅次于缓存加载,如果要加载一个与核心模块标识符相同的自定义模块,那是不会成功的。如,你自己编写了一个http用户模块,想要加载成功,就必须选择一个不同的标识符或者使用路径的形式。
2.2.路径形式的文件模块
以..和/开始的标识符都被当作文件模块来处理。在分析路径模块时,require()方法会将路径转化为真实路径,并以真实路径作为索引,将编译执行后的结果存放在缓存中,以使二次加载时更快。由于指定了确切的文件位置,所以在查找过程中可以节约大量时间,其加载速度慢于核心模块。
2.3自定义模块
自定义模块指非核心模块,也不是路径形式的标志符。它是一种特殊的文件模块,可能是一个文件或者包的形式。这类模块的查找是最耗时的。
在介绍自定义模块的查找方法之前,需要先介绍一下模块路径这个概念。
模块路径是nodejs在定位文件模块的具体文件时制定的查找策略,其具体表现为一个路径组成的数组。例如:
(1)创建一个module_path.js文件,其内容为console.log(module.path);
(2)将其放在任何一个目录中,然后执行node module_path.js
在Linux下,你可能得到的时这样一个数组输出:
['/home/jack/res/node_modules',
'/home/jack/node_modules',
'/home/node_modules',
'/node_modules']
在windows下,可能如下:
['c:\\nodejs\\node_modules','c:\\node_modules']
可以看出,模块路径的生成规则如下:
1.当前文件目录下的node_modules目录
2.父目录下node_modules目录
3.父目录的父目录的node_modules目录
4.沿路径向上逐级递归,直到根目录下的node_modules目录
在加载的过程中,nodejs会逐个尝试模块路径中的路径,直到找到目标文件为止。所以当前文件的路径越深,模块查找耗时就越多,这是自定义模块的加载速度最慢的原因
三.文件定位
从缓存加载的优化策略使得二次引入时不需要路径分析,文件定位和编译执行的过程,大大提高了再次加载模块时的效率。
但在文件定位过程中,还是一些细节需要主意,这主要包括文件扩展名的分析,目录和包的处理
1.文件扩展名分析
require()在分析标识符的过程中,会出现标识符中不存在文件扩展名的情况。在这个情况下,nodejs会按.js,.node,.json的次序补充扩展名,依次尝试。在尝试的过程中需要调用fs模块同步阻塞式的判断文件是否存在。所以,如果是.node或.json文件加上扩展名会加快一点速度。
2.目录分析和包
在分析标识符的过程中,require()通过分析文件扩展名之后,可能没有查找到对应的文件,但是得到一个目录,这是nodejs会将目录当作一个包处理。
在这个过程中,首先,nodejs在当前目录下查找package.json,通过JSON.parse()解析出包描述对象,从中取出main属性指定的文件名进行定位,如果文件名缺少扩展名,就将进入扩展名分析的步骤。如果main属性指定的文件名错误,或者没有package.json文件,就将index作为默认文件名,然后依次查找index.js,index.node,index.json。如果在目录分析过程中没有定位成功任何文件,则自定义模块进入下一个模块路径进行查找,如果所以的模块路径都查找完毕还是没有找到目标文件,则会抛出查找异常。
四.模块编译
在nodejs中,每一个文件模块都是一个对象
执行和编译是引入文件模块的最后一个阶段。定位到具体文件后,nodejs会新建一个模块对象,然后根据路径载入并编译,对于不同的扩展名载入的方法有所不同。
1..js文件。通过fs模块同步读取文件后编译执行
2..node文件。这是通过c/c++编写的扩展文件。通过dlopen()加载最后编译生成的文件
3..json文件。通过fs模块同步读取文件后,用JSON.parse()解析返回结果
4.其他扩展名文件。它们都被当作js文件载入
注:《深入浅出nodejs》学习笔记