JVM的自动内存管理机制

最近开始学习JVM,这里整理一下方便以后复习。

运行时数据区域

程序计数器

程序计数器是一块较小的内存空间,它可以看作是当前线程所执行的字节码的行号指示器。字节码解释器通过程序计数器选取下一条要执行的指令。需要注意的是没条线程都有一个独立的程序计数器,互不影响,独立存储。如果线程正在执行的是一个Java方法,这个计数器记录的是正在执行的虚拟机字节码的指令地址;对于Native 方法(DLL库之类的外部代码,混编的时候)计数器是空的。指令计数器没有OutOfMemoryError。

Java虚拟机栈

Java虚拟机栈是线程私有的,每个方法在执行的同时都会创建一个栈帧,栈帧里面存储着局部变量表、操作数栈、动态链接、方法出口等信息。
局部变量表包括各种基本数据类型、对象引用和returnAddress。变量表所需的内存空间在帧中分配多大的局部变量空间是完全确定的,在运行期间不会改变。

Java虚拟机栈会发生两种异常,线程请求的栈深度大于虚拟机所允许的深度会抛出*Error异常;如果虚拟机可以动态扩展扩展时无法申请到足够的内存会抛出 OutOfMemoryError异常。

本地方法栈

本地方法栈是为虚拟机使用到的Native方法服务。

Java堆

堆是Java虚拟机所管理的内存中最大的一块内存区域。Java堆是被所有线程共享的,在虚拟机启动时Java堆会被创建来存储实例对象,几乎所有对象实例都在这里分配内存。Java堆可以处在物理上不连续的内存空间中,只要是逻辑上连续的就可以。当前主流的Java堆是可扩展的, 当堆缺少内存而且无法扩展就会抛出Ou tOfMemoryError。

方法区

和Java堆一样, 方法区是线程共享的区域,它用于存放已经被虚拟机加载的类的信息、常量、静态变量、即时编译器编译后产生的代码等数据。

运行时常量池

运行时常量池是方法区的一部分。在class文件中有常量池用来存放编译期生成的各种字面量和符号引用,这部分内容会在类加载后进入方法区的运行时常量池中存放。运行时常量池具备动态性,运行期间可能会有新的常量进入常量池,例如String的intern()方法。

下面将会以HotSpot为例详细了解一下Java堆中对对象分配、布局和访问的全过程。

HotSpot的Java堆

对象的创建

当虚拟机遇到一条new指令时会先去检查这个指令的参数是否能在常量池中定位到一个类的符号引用,并且检查这个类是否被加载、解析、初始化过。如果没有那必须先执行类的加载过程。

当类被加载过后,需要被分配内存。为对象分配空间等同于把一块确定大小的内存从堆中分配出来。分配内存的方法分为指针碰撞和空闲列表。因为内存分配是非常频繁的行为, 在并发情况下并非是线程安全的,主要有两种方法解决兵法问题:一、同步处理,CAS处理配上失败重试来保证更新操作的原子性;二、把内存分配按照线程划分在不同的空间进行,预先为每个线程划分一个缓冲TLAB。分配内存时线程先使用自己的缓冲,用完缓冲时才进行同步锁定分配新的线程缓冲。

接下来虚拟机需要对对象进行设置,例如这个对象是哪个类的实例,如何才能找到类的元数据,对象哈希码、对象的GC分代年龄。这些信息存放在对象头之中。

最后需要对新的对象按照程序猿的设置进行初始化。

对象的内存布局

这部分包括了对象头、实例数据和对齐填充。对象头包括两部分信息:第一部分用来存储对象自身运行时的数据。第二部分是指向元数据的类型指针,虚拟机通过这个指针确定对象是哪个类的实例。

实例数据是对象存储的真正有效的信息。无论是自身定义的还是从父类继承的都必须记录。

对象的具体定位

Java程序通过栈上的reference数据来操作堆上的具体对象。Reference类型只规定了一个指向对象的引用,并没有给出具体的实现方式,目前由虚拟机所规定的主流访问方式有指针和句柄两种。

  • 句柄,java堆中会分出来一部分内存作为句柄池,reference对象中存储的是句柄地址,句柄中班喊了对象实例数据和类型数据各自的具体地址信息。如图:

JVM的自动内存管理机制

  • 指针,java堆中存放指向对象数据类型的指针,如下图
    JVM的自动内存管理机制

句柄访问方式稳定,对象移动时只需改变指向对象实例数据的指针。指针访问方式快捷,省下了一次指针定位的开销。

以上就是JVM内存管理的介绍,参考源自于《Java虚拟机:JVM高级特性与最佳实战》