深入理解JVM(六):虚拟机类加载机制
虚拟机把描述类的数据从Class文件加载到内存,并对数据进行校验、转换解析和初始化,最终形成可以被虚拟机直接使用的Java类型,这就是虚拟机的类加载机制。
在Java中,类型的加载、连接和初始化过程都是程序在运行期间完成的,这种策略虽然会令类加载时稍微增加一些性能开销,但是会为Java应用程序提供高度的灵活性。Java里天生的动态扩展语言特性就是依赖运行期动态加载和动态连接这个特点实现的。
1. 类加载的时机
从类被加载到虚拟机内存中开始,到卸载出内存为止,它的整个生命周期包括:加载、验证、准备、解析、初始化、使用和卸载7个阶段。其中验证、准备、解析3个部分统称为连接。这7个阶段发生的顺序如图所示。
加载、验证、准备、初始化和卸载这个5阶段的顺序是确定,类的加载过程必须按照这种顺序按部就班地开始。而解析阶段则不一定:它在某些情况下可以在初始化阶段之后开始,这是为了支持Java语言运行时绑定(也称为动态绑定或者晚期绑定)。
注意:这里是写的是按部就班的开始,而不是按部就班的“进行或者完成”,强调这点是因为这些阶段都是交叉地混合式进行的,通常会在一个阶段执行的过程中调用、**另外一个阶段。
1.1 必须对类进行“初始化”的5种情况
什么情况下开始类加载中的加载过程,虚拟机并没有进行强制约束,这点可以交给虚拟机的具体实现来自由把握, 但是对于初始化阶段,虚拟机规范则是严格规定了有且只有5种情况必须对类进行“初始化”(而加载、验证、准备自然需要在此之前开始)。
(1)使用new 关键字实例化对象的时候(对应的字节码指令是new)、读取或设置一个类的静态字段(被final修饰、已在编译期把结果放入常量池的静态字段除外)的时候,以及调用一个类的静态方法的时候。
(2)使用java.lang.reflect包的方法对类进行反射调用的时候,如果类没有进行初始化,则需要先触发其初始化。
(3)当初始化一个类的时候,如果其父类还没有初始化,则需要先触发其父类的初始化。
(4)当虚拟机启动时,用户需要制定一个要执行的主类,虚拟机会先初始化这个主类。
(5)当使用JDK1.7的动态语言支持的一些情况。
这5种场景中的行为称之为对一个类进行主动引用。除此之外,所有的引用类的方式都不会触发初始化,称为被动引用。下面是三个被动引用的例子:
(1)通过子类引用父类的静态字段,不会导致子类初始化。
(2)通过数组定义引用类(创建数组的指令不是new),不会触发此类的初始化。
(3)常量(变量加上final修饰)在编译阶段会存入调用类的常量池中,本质上并没有直接引用定义常量的类,因此不会触发定义常量的类的初始化。
接口的加载过程与类加载的过程稍有一些不同,接口也有初始化过程,这点与类是一致的,上面的代码都是用静态语句块"static{}"来输出初始化信息的,而接口中不能使用“static{}”语句块,但编译器仍然会为接口生成“<clinit()>”类构造器,用于初始化接口中所定义的成员变量。接口与类真正有所区别的是前面讲述的5种"有且仅有"需要开始初始化场景中的第3种:当一个类再初始化时,要求其父类全部都已经初始化过了,但是一个接口在初始化的时候,并不要求其父接口全部完成了初始化,只有在真正使用到父接口的时候才会初始化。
2. 类加载的过程
接下来我们详细讲解一下Java虚拟机中类加载的全过程,也就是“加载、验证、准备、解析和初始化”这个5阶段。
2.1 加载
在加载阶段需要完成的三件事:
(1) 通过一个类的全限定名来获取定义此类的二进制字节流
(2)将这个字节流代表的静态存储结构转化为方法区的运行时数据结构。
(3)在内存中生成一个代表这个类的java.lang.Class对象,作为方法区这个类的各种数据的访问入口。