深入理解JAVA虚拟机阅读随笔(一)运行时数据区域

Java虚拟机在执行JAVA程序的过程中会把它所管理的内存划分为若干个不同的数据区域。这些区域都有各自的用途,以及创建和销毁的时间,有的区域随着虚拟机进程的启动而存在,有的区域则依赖用户线程的启动和结束而建立和销毁。根据《Java虚拟机规范(Java SE 7 版)》的规定,Java虚拟机所管理的内存将会包括以下几个运行时数据区域:

深入理解JAVA虚拟机阅读随笔(一)运行时数据区域
jvm运行时数据区域结构图

 从图中我们可以看出,程序计数器,本地方法栈,java虚拟机栈是属于线程私有区的模块,这三个部分基于用户线程的执行而创建和销毁。方法区和堆是属于线程共享区的模块,这两个部分基于java虚拟机进程的执行而创建和销毁。接下来我们针对不同的模块进行解释。

  • 程序计数器(Program Counter Register)

程序计数器(Program Counter Register)是一块较小的内存空间,它可以看做是当前线程所执行的字节码的行号指示器。在虚拟机的概念模型里(仅是概念模型,因为各种虚拟机可能会通过一些高效的方式去实现),字节码解释器就是通过改变程序计数器的值来选取下一条需要执行的字节码指令,分支、循环、跳转、异常处理、线程恢复等基础功能都依赖于程序计数器来完成。

由于Java虚拟机的多线程是通过线程轮流切换并分配处理器执行时间来实现的,在任何一个确定的时刻,一个处理器(对多核处理器来说是一个内核)都会执行一条线程中的指令。因此,为了保证线程切换后能恢复到正确的执行位置,每条线程都会有一个独立的程序计数器,各条线程之间计数器互不影响,独立存储,我们称这类区域为“线程私有”的内存。

另外需要注意的是,如果一个线程执行的是java方法,那么程序计数器记录的就是虚拟机中正在执行的字节码指令地址。如果执行的是native方法,程序计数器的值就是空(undefined)。此类内存区域是唯一一个在java虚拟机中没有规定任何OutOfMemoryError的区域。

  • Java虚拟机栈(Java Virtual Machine Stacks)

与程序计数器一样,java虚拟机栈也是线程私有的,它的生命周期也和线程是相同的。java虚拟机栈描述的是java方法执行的内存模型。每个方法在执行的同时会创建一个栈帧(Stack Frame)用于存储局部变量表,操作数栈,动态链接,方法出口等信息。每一个方法从调用到结束都对应着一个栈帧在虚拟机栈中从入栈到出栈的过程。

局部变量表里存储的是方法的参数,方法内部定义的变量等信息。是一片逻辑连续的内存空间,最小单位是slot。局部变量表存放了编译器可知的各种基本数据类型(boolean,byte,char,int,short,float,double,long)、对象引用(reference类型,它不同意对象本身,可能是一个指向引用对象起始地址的指针,也可能是指向一个代表对象的句柄或者其他与此对象相关的位置)和returnAddress类型(指向一条字节码指令的地址)。其中,64位的double,long类型的数据会占用两个局部变量空间slot,其余类型都占用一个局部变量空间。局部变量表的内存空间在编译期完成分配,当进入一个方法时,这个方法需要在帧中分配多大的局部变量空间是完全确定的,在方法运行期间不会改变局部变量表的大小。

在java虚拟机规范中,对这个区域规定了两种异常状况:如果线程请求的栈深度大于虚拟机所允许的深度,将抛出*Error的异常;如果虚拟机栈可以动态扩展(当前大部分的虚拟机栈可以动态扩展,只不过虚拟机规范中也允许固定长度的虚拟机栈),当扩展时无法申请到足够的内存时,会抛出OutOfMemoryError异常。

  • 本地方法栈(Native Method Stack)

本地方法栈与虚拟机栈所发挥的作用是非常相似的。它们之间的区别不过是虚拟机栈是为虚拟机执行java方法(也就是字节码)而服务,而本地方法栈是为虚拟机执行本地方法而服务。在虚拟机规范中,并没有对本地方法栈中方法所使用的语言,使用方法和数据结构进行强制规定,因为各个虚拟机可以*实现它。甚至有的虚拟机(例如Sun HotSpot虚拟机)直接把本地方法栈和虚拟机栈合二为一。与虚拟机一样,本地方法栈也会爆出*Error和OutOfMemoryError异常。

  • Java堆(Heap)

对于大多数的应用来说,java堆是虚拟机中所管理的内存最大的一块。java堆是被所有线程共享的一块区域,随着虚拟机的启动而创建。此内存区域存在的唯一目的就是存放对象实例,几乎所有的对象实例都在这里分配。java虚拟机规范中是这样描述的:所有的对象实例以及数组都要在对上分配,但是随着JIT编译器的发展与逃逸分析技术的逐渐成熟,栈上分配,标量替换优化技术将会导致一些微妙的变化发生,所有的对象都分配在堆上也渐渐的变得不是那么“绝对”了。

java堆是垃圾收集器管理的主要区域。因此很多时候也被称为“GC堆”(Garbage Collected Heap)。根据java虚拟机规范的规定,java堆可以处于物理上不连续的内存空间中,只要逻辑上是连续的即可,就像我们的磁盘空间一样。在实现时,即可以实现成固定大小,也可以是可扩展的,不过当前主流的虚拟机都是可扩展的(大小可以通过-Xmx和-Xms来控制)。如果在堆中没有内存完成分配,并且堆也无法在扩展时,会抛出OutOfMemoryError异常。

  • 方法区(Method Area)

与java堆一样,方法区也是各个线程共享的区域。它用于存储已被虚拟机加载的类信息、常量、静态变量、即时编译器编译后的代码等数据。虽然java虚拟机规范把方法区作为堆得一个逻辑部分,但是它却有一个别名叫“Non-Heap”(非堆),目的应该是与java堆区分开来。

java虚拟机规范对方法区的约束十分宽松。除了和java堆一样不需要物理上连续的内存和可以选择固定大小或者可扩展外,还可以选择不实现垃圾收集。相对而言,垃圾收集行为在这个区域是很少出现的,但并非不会出现。方法区的垃圾回收主要是针对常量池的回收和对类型的卸载,一般来说,这个区域的垃圾回收“成绩”比较难以令人满意,尤其是类型的卸载,条件相当苛刻。但是这部分的回收确实是有必要的,Sun公司就曾经出现过若干个因为此区域的回收不完全而导致内存泄漏问题。

根据java虚拟机规范的规定,当方法去无法满足内存分配需求时,将抛出OutOfMemoryError异常。

  • 运行时常量池(Runtime Constant Pool)

运行时常量池是方法区的一部分。Class文件中除了有类的版本、字段、方法、接口等描述信息外,还有个部分是常量池(Constant Pool Table),用于存放编译器生成的各种字面量和符号引用,这部分内容在类加载后会进入方法取得运行时常量池存储。

Java虚拟机对Class文件的每一部分都有严格的规定,没一个字节用于存储哪种数据是必须符合规范上的要求才会被虚拟机认可,装在和执行,但对于运行时常量池,java虚拟机没有做任何细节的要求,不同的提供商实现的虚拟机可以按照自己的需求来实现这个内存区域。不过,一般来说,除了保存Class文件中描述的符号引用外,还会把翻译出来的直接引用也存储在运行时常量池。

运行时常量池相比对Class文件的常量池的两外一个重要的特征是具有动态性。Java语言并不要求常量只有在编译时才能产生,也就是并非预置入Class文件中常量池的内容才能进入运行时常量池,运行期间也可能将新的常量存入运行时常量池。例如String类的intern()方法。

既然是方法区的一部分,自然受到方法区的限制,当运行时常量池申请不到足够的内存空间时,会抛出OutOfMemoryError异常。

  • 直接内存(Direct Memory)

直接内存不属于java虚拟机运行时数据区,也不是java虚拟机中规定的内存区域。但是这部分内存也被频繁的使用,而且可能导致OutOfMemoryError。

在JDK1.4中新加入了NIO(NEW Input/Output)类,引入了一种基于通道(Channel)与缓冲区(buffer)的I/O方式,它可以使用native函数库直接分配对外内存,然后通过存储在java堆中的DirectByteBuffer对象作为这块内存的引用进行操作,这样能在一些场景中显著提高性能,因为避免了在java堆和native堆之间来回复制数据。

显然,本机直接内存的大小不受java虚拟机的限制,但是,既然是内存,肯定还是会受到本机内存(包括RAM和SWAP区或者分页文件)大小以及处理器寻址空间的限制。服务器管理人员在配置虚拟机参数时,会根据实际内存来设置-Xmx等参数信息,但经常忽略掉直接内存,使得各个内存区域的总和大于物理内存限制(包括物理的和操作系统级的限制),从而导致动态扩展内存时抛出OutOfMemoryError异常。