堆的核心概述
一个JVM实例只存在一个堆内存。堆也是Java内存管理的核心区域,Java堆区在JVM启动时被创建,其空间大小也就确定了,是JVM管理的最大一块内存空间。堆内存的大小是可以调节的。《Java虚拟机规范》规定,堆可以处在物理上不连续的内存空间,但在逻辑上它应该被视为连续的。所有的线程共享Java堆,在这里还可以划分线程私有的缓冲区(TLAB)。
几乎所有的对象实例都在堆里分配内存。数组和对象可能永远不会存储在栈上,因为栈中保存引用,这个引用指向对象或者数组在堆中的位置。在方法结束后,堆中的对象不会马上被移除,仅仅在垃圾收集的时候才会被移除。堆,是GC执行垃圾回收的重点区域。
在Java7及以前,堆划分为年轻代+老年代+永久代。
在Java8及以后,堆划分为年轻代+老年代+元空间。
Java堆的大小在JVM启动时就设定好了,可以通过“-Xms"和"-Xmx"来设置。”-Xms"用来设置堆区的起始内存,等价于-XX:InitialHeapSize。”-Xmx"则用于表示堆区的最大内存,等价于-XX:MaxHeapSize。
一旦堆区中的内存大小超过“-Xmx"所指定的最大内存时,将会抛出OutOfMemoryError异常。
通常会将-Xms和-Xmx两个参数配置相同的值,其目的是为了将够在Java垃圾回收机制清理完堆区后不需要重新分隔计算堆区的大小,从而提高性能。
默认情况下,初始内存大小:物理电脑内存大小/64。最大内存大小:物理电脑内存大小/4。
年轻代与老年代:
存储在JVM中的Java对象可以被划分为两类:
一类是生命周期较短的瞬时对象,这类对象创建和消亡都非常迅速。
另一类对象的生命周期却非常长,在某些极端的情况下还能与JVM的生命周期保持一致。
Java堆区进一步细分的话,可以划分为年轻代和老年代。其中年轻代又可以划分为Eden空间、Survivor0空间和Survivor1空间(有时候也叫from区,to区)。
新生代与老年代在堆中的占比:默认-XX:NewRatio=2,表示新生代占1,老年代占2,新生代占整个堆的1/3。
在HotSpot中,Eden空间和另外两个Survivor空间缺省所占的比例是8:1:1。开发人员可以通过”-XX:SurvivorRatio“调整这个空间比例,比如-XX:SurvivorRatio=8。
几乎所有的Java对象都是在Eden区被new出来的。
绝大部分的Java对象的销毁都在新生代进行了。
可以使用”-Xmn"设置新生代最大内存大小。这个参数一般使用默认值就可以了。
对象分配过程:
1.new的对象先放在Eden区,此区大小有限制。
2.当Eden区空间填满时,程序又需要创建对象,JVM的垃圾回收器将对Eden区进行垃圾回收(Minor GC),将Eden区中不再被其他对象所引用的对象进行销毁。
3.然后将Eden区中的剩余对象移到Survivor0区。
4.如果再次出发垃圾回收,此时上次幸存下来的放到Survivor0区的,如果没有回收,就会放到Survivor1区。
5.如果此时再此经历垃圾回收,此时会重新放回Survivor0区,接着再去Survivor1区。
6.当对象的年龄达到15的时候,就会去养老区。(可以设置参数:-XX:MaxTenuringThreshold=<N>进行设置。
7.当养老区内存不足时,再次出发GC:Major GC,进行养老区的内存清理。
8.若养老区执行了Major GC之后依然无法进行对象的保存,就会产生OOM(OutOfMemoryError)异常。
总结:
针对Survivor0,Survivor1区的总结:复制之后有交换,谁空谁是to.
关于垃圾回收:频繁在新生区收集,很少在养老区收集,几乎不在方法区收集。
垃圾收集:Minor GC、Major GC、Full GC
新生代收集(Minor GC/Young GC):只是新生代的垃圾收集。
老年代收集(Major GC/Old GC):只是老年代的垃圾收集。
目前,只有CMS GC会有单独收集老年代的行为。
注意:很多时候Major GC会和Full GC混肴使用,需要具体分辨是老年代回收还是整堆回收。
混合收集(Mixed GC):收集整个新生代以及部分老年代的垃圾收集。
目前,只有G1 GC会有这种行为。
整堆收集(Full GC):收集整个Java堆和方法区的垃圾收集。
年轻代GC(Minor GC)的触发机制:
当年轻代空间不足时,就会触发Minor GC,这里的年轻代满指的是Eden区满,Survivor满不会引发GC。
因为Java对象大多都具备朝生夕灭的特性,所以Minor GC会非常频繁,一般回收速度也比较快。
Minor GC会引起SWT,暂停其它用户的线程,等垃圾回收结束,用户线程才恢复运行。
老年代GC(Major GC/Full GC)的触发机制:
指发生在老年代的GC,对象从老年代消失时,我们说“Major GC"或”Full GC"发生了。
出现了Major GC,经常会伴随至少一次的Full GC。也就是说,在老年代空间不足时,会先尝试触发Major GC。如果之后空间还不足,则触发Full GC。
Major GC的速度一般会比Minor GC慢10倍以上,SWT时间更长。
如果Full GC后,内存还不足,就报OOM了。
Full GC的触发机制:
调用System.gc()时,系统建议执行Full GC,但是不必然执行。
老年代空间不足。
方法区空间不足。
通过Minor GC后进入老年代的平均大小大于老年代的可用内存。
由Eden区,survivor0,survivor1区复制时,对象大小大于survivor区大小,将对象转至老年区,且老年区可用内存大小小于该对象大小。
注意:Full GC是开发或调优中尽量要避免的,这样暂停时间会短一些。
什么是TLAB?
从内存模型而不是垃圾收集的角度,对Eden区域继续进行划分,JVM为每个线程分配了一个私有缓存区域,它包括在Eden空间内。
多线程同时分配内存时,使用TLAB可以避免一系列的非线程安全问题,同时还能提升内存分配的吞吐量,因此我们可以将这种内存分配方式称为快速分配策略。
尽管不是所有对象实例都能够在TLAB中成功分配内存,但JVM是将TLAB作为内存分配的首选。一旦对象在TLAB空间分配内存失败,JVM就会尝试着通过使用加锁机制确保数据操作的原子性,从而直接在Eden空间中分配内存。
目前所有的OpenJDK衍生出来的JVM都提供了TLAB的设计。
为什么有TLAB?
堆区是线程共享区域,任何线程都可以访问到堆中的共享数据。
由于对象实例的创建在JVM中非常频繁,因此在并发环境下从堆区中划分内存空间是线程不安全的。
为避免多个线程操作同一地址,需要使用加锁等机制,进而影响分配速度。