jvm学习总结—java内存区域(1)
本文以学习总结为主,这一篇主要是了解下java各个内存区域的作用。
注:文中大部分摘自《深入理解Java虚拟机(第二版)》
java与c++之间有一堵由内存动态分配和垃圾收集技术所围成的“高墙”,墙外面的人想进去,墙里面的人想出来。
目录:
1.运行时数据区域
1.1 程序计数器
1.2 Java虚拟机栈
1.3 本地方法栈
1.4 Java堆
1.5 方法区
2 HotSpot 对象的创建和内存布局
2.1 对象的创建
2.2 对象的内存布局
2.3 对象的访问定位
正文:
1.运行时数据区域
Java虚拟机内存模型包括程序计数器、虚拟机栈、本地方法栈、方法区、堆,如图所示
1.1 程序计数器
程序计数器是一块较小的内存空间,可以看作当前线程所执行的字节码行号指示器.如下特点:
- 程序计数器是线程私有,各线程之间互不影响
- 如果正在执行java方法,计数器记录的是正在执行的虚拟机字节码指令地址
- 如果执行native方法,这个计数器为null
- Java虚拟机规范中唯一没有规定任何OutOfMemoryError异常情况的区域
1.2 Java虚拟机栈
虚拟机栈描述的是java方法执行的内存模型:每个方法在执行的同时都会创建一个栈帧用于存储局部变量表、操作数栈、动态链接、方法出口等信息。有如下特点:
- Java虚拟机栈也是线程私有的,它的生命周期与线程相同。
- 每一个方法从调用直至执行完成的过程,就对应一个栈帧在虚拟机栈中入栈到出栈的过程。
- 人们口中说的“堆”“栈”内存中的“栈”就是指的Java虚拟机,或者说是虚拟机栈中的局部变量表
- 局部变量表:存放了编译期可知的各种基本类型(八种基本类型)、对象引用(reference类型:指针或句柄)、returnAddredd类型(指向了一条字节码指令的地址)
- Java虚拟机规范中规定了两种异常状况:*Error异常(如果线程请求的栈深度大于虚拟机所允许的深度);OutOfMemoryError异常(如果虚拟机栈可以动态扩展,如果扩展时无法申请到足够的内存)
1.3 本地方法栈
本地方法栈是线程私有,与虚拟机栈类似,为native方法服务。
1.4 Java堆
堆是JVM中最大的一块区域,线程共享,此区唯一的目的就是存放对象实例,几乎所有对象实例都在这里分配,但是随着JIT编译器及逃逸分析技术的发展,栈上分配、标量替换优化技术将会导致一些微妙的变化,所有对象都分配在堆上渐渐变的不是那么绝对。如下特点:
- 垃圾收集器管理的主要区域,由于现在来及收集器基本采用分代收集算法,所以Java堆主要被分为新生代,老年代;
- 新生代:包括Eden区、From Survivor区、To Survivor区,系统默认大小Eden:Survivor=8:1;
- 老年代:某些原因从新生代晋升到老年代(具体策略请见下文)
- java堆可能被划分出多个线程私有的分配缓冲区(Thread Local Allocation Buffer,TLAB)(为了更好地回收内存或分配内存)
- Java虚拟机规范中规定了一种异常:OutOfMemoryError(如果堆中没有内存完成实例分配,并且也无法扩展时)
1.5 方法区
各个线程共享,用于储存已被虚拟机加载的类信息、常量、静态变量,即编译器编译后的代码。方法区也称“永久代”(Permanent Generation),主要存放java类定义信息,与垃圾回收关系不大,但不是没有垃圾回收,这个区域的内存回收目标主要是针对常量池的回收和对类型的卸载。运行时常量池,方法区的一部分,虚拟机加载Class后把常量池中的数据放入运行时常量池。
- Java虚拟机规范中规定了一种异常:OutOfMemoryError(没有内存完成分配)
- JDK1.7中 把永久代的字符串常量池移出
2 HotSpot 对象的创建和内存布局
2.1 对象的创建
在语言层次上,创建对象(克隆或反序列化)通常仅仅是一个new关键字而已,而在虚拟机中,对象(这里只讨论普通java对象,不包括数组和Class对象等)的创建是怎么一回事呢?
1. 虚拟机遇到一条new指令时首先将去检查这个指令是否能在常量池中定位到一个类的符号引用,并检查这个符号引用代表的类是否已经被加载、解析和初始化过。如果没有则必须先执行相应的类加载过程。
2. 类加载检查通过后,虚拟机将为新生对象分配内存,对象所需内存大小在类加载完成后便可完全确定了(如何确定在后续会讲),等同于把一块确定大小的内存从java堆中划分出来。
3. 对象内存分配有两种方式,“指针碰撞”、“空闲列表”。具体使用哪种分配方式取决于Java堆中的内存是否规整。
4. 指针碰撞:假设Java堆中的内存是绝对规整的,所有用过的内存都放在一边,空闲的内存放在一边中间放着一个指针作为分界点的指示器,那所分配的内存就仅仅是把那个指针向空闲那边移动一段对象大小相等的距离,这种分配方式称为“指针碰撞”
5. 空闲列表:如果Java堆中的内存不是规整的,已使用的内存和空闲的内存相互交错,就没办法使用指针碰撞了,虚拟机就必须维护一个列表记录哪些内存块是可用的,在分配的时候在列表内存找到一块足够的的内存划分给对象实例,并更新列表上的数据。
选择哪种分配方式取决于Java堆是否规整,而Java堆是否规整又由所采用的垃圾回收器是否带有压缩整理功能决定。因此在使用Serial,ParNew等带Compact过程的收集器时系统采用的分配算法是指针碰撞,而使用CMS这种 基于Mark-Sweep算法的收集器时,通常采用的是空闲列表。
值得注意的是对象分配并不是线程安全的。解决这个有两种方案:
- 虚拟机采用CAS配上失败重试方式保证更新操作的原子性
- 虚拟机为每个线程在堆中预先分配一小块内存,称为本地线程分配缓冲(TLAB)。哪个线程要给分配内存,就在哪个线程的TLAB上分配,只有在TLAB用完并分配新的TLAB时,才需要同步锁锁定。虚拟机是否使用TLAB,可以通过-XX:+/-UseTlab参数来决定
6. 内存分配完成后,虚拟机要将分配到的内存空间都初始化为零值(不包括对象头),这一步保证了对象的实例字段在java代码中可以不赋初始值就直接使用
7. 接下来,虚拟机要对对象进行必要的设置,例这个对象属于哪个类的实例,类的元数据信息位置,对象的哈希码、GC分代年龄等信息。这些信息放在对象头之中。
8.上面的工作完成,从虚拟机的角度来看一个新的对象产生了,从java的角度看对象刚刚开始,所以一般来说,执行new指令后执行<init>方法把对象按照程序员的意愿进行初始化,到这一个真正可用的对象才算完全产生出来。
2.2 对象的内存布局
- 对象头:对象头包括两部分,1、存储对象自身的运行时数据(哈希码,GC分代年龄,锁状态标识,线程持有的锁,偏向线程id,偏向时间戳等);2、类型指针(虚拟机通过这个指针来确定这个对象是哪个类的实例);注:如果对象是一个java数组,拿在对象头中还必须有一块用于记录数组长度的数据,因为虚拟机可以通过普通对象的元数据确定对象的大小,但从数组的元数据中无法确定数组的大小。
- 实例数据:真正存储的有效信息
- 对齐填充:该部分并不是必然存在的,也没有特殊的含义,仅仅起到占位符的作用(HotSpot VM规定对象的起始地址必须是8字节的整数倍,对齐填充就是用来填补的)
2.3 对象的访问定位
- 句柄:如果是句柄访问,那么Java堆中划分出一块内存来作为句柄池,reference中存储的就是句柄地址。
- 直接指针: 那么reference中存储的直接就是对象地址。