JVM垃圾收集器与内存分配策略(一)

1、对象已死?

在堆里存放着Java世界几乎所有的对象实例,垃圾收集器在堆进行回收前,第一件事情就是要确定这些对象之中哪些还 “存活” 着,哪些已经 “死去” (即不可能再被任何途径使用了)。

1.1、引用计数法

在对象中添加一个引用计数器,每当有一个地方引用它时,计数器的值就加一;当引用失效时,计数器值减一;任何时刻计数器为零的对象就是不可能再被使用的。但是,在Java领域,至少主流的Java虚拟机里面都没有选用引用计数来管理内存,主要原因是,单纯的引用技术很难解决对象之间相互循环引用的问题。

1.2、可达性分析算法

当前主流的商用程序语言(Java、C#)的内存管理子系统,都是通过可达性分析(Reachability Analysis)算法来判定对象是否存活的。这个算法的基本思路就是通过一系列称为 “GC Roots” 的根对象作为起始节点,从这些结点开始,根据引用关系向下搜索,搜多过程所走过的路径称为 “引用链”(Reference Chain),如果某个对象到GC Roots 间没有任何引用链相连,或者用图论的话来说就是从GC Roots 到这个对象不可达时,则证明此对象是不可能再被使用的。如图所示:

JVM垃圾收集器与内存分配策略(一)
在Java技术体系里面,固定可作为GC Roots的对象包括以下几种:

  • 在虚拟机栈(栈帧中的本地变量表)中引用的对象,譬如各个线程被调用的方法堆栈中使用到的参数、局部变量、临时变量等。
  • 在方法区中类静态属性引用的对象,譬如Java类的引用类型静态变量。
  • 在方法区中常量引用的对象,譬如字符串常量池(String Table)里的引用。
  • 在本地方法栈中JNI(即通常所说的Native方法)引用的对象。
  • Java虚拟机内部的引用,如基本数据类型对象的Class对象,一些常驻的异常对象(比如NullPointerException、OutOfMemoryError)等,还有系统类加载器。
  • 所有被同步锁(Sunchronized 关键字)持有的对象。
  • 反映Java虚拟机内部情况的JMXBean、JVMTI中注册的回调、本地代码缓存等。

1.3、再谈引用

在JDK1.2版本之后,Java对引用的概念进行了扩充,将引用分为强引用(Strongly Reference)、软引用(Soft Reference)、弱引用(Weak Reference)和虚引用(Phantom Reference)4种,这4种引用强度依次减弱。

  • 强引用是最传统的“引用”的定义,是指在程序代码之中普遍存在的引用赋值,即类似“Object obj = new Object()”这种引用关系。无论任何情况下’只要强引用关系还在,垃圾收集器就永远不会回收掉被引用的对象。
  • 软引用是用来描述一些还有用,但非必须的对象。只被软引用关联着的对象,在系统将要发生内存溢出异常前,会把这些对象列进可回收范围之中进行二次回收,如果这次回收还没有足够的内存,才会抛出内存溢出异常。
  • 弱引用也是用来描述那些非必须对象,但是它的强度比软引用更弱一些,被弱引用关联着的对象只能生存到下一次垃圾收集发生为止。当垃圾收集器开始工作,无论当前内存是否足够,都会回收掉被弱引用关联的对象。
  • 虚引用也称为“幽灵引用”或者“幻影引用”,它是最弱的一种引用关系。一个对象是否有虚引用的存在,完全不会对其生存时间构成影响,也无法通过虚引用来取得一个对象的实例。为一个对象设置虚引用关联的唯一目的只是为了能在这个对象被收集器回收的时候收到一个系统通知。

1.4、生存还是死亡?

即使在可达性算法中判定为不可达对象,也不是“非死不可”的,这时候他们暂时还处于“缓刑”阶段,要真正宣告一个对象死亡,至少要经历两次标记过程:如果对象在可达性分析后发现没有与GC Roots相连的引用链,那它将会被第一次标记,随后进行一次筛选,筛选的条件是此对象是否有必要执行finalize()方法。假如对象没有覆盖finalize()方法,或者finalize()方法已经被虚拟机调用过,那么虚拟机将这两种情况都视为“没有必要执行”。如果这个对象被判定为有必要执行finalize()方法,那么该对象将会被放置在一个名为F-Queue的队列之中,并在稍后由一条虚拟机自动建立的、低调度优先级的Finalizer线程去执行他们的finalize()方法。这里所说的“执行”是指虚拟机会触发这个方法开始运行,但并不承若一定会等待它允许结束。这样做的原因是,如果某个对象的finalize()方法执行缓慢,或者更极端地发生了死循环,将很可能导致F-Queue队列中的其他对象永久处于等待,甚至导致整个内存回收子系统奔溃。finalize()方法是对象逃脱死亡命运的最后一次机会,稍后收集器将对于F-Queue中的对象进行第二次小规模的标记,如果对象要在finalize()中成功拯救自己—只有重新与引用链上任何一个对象关联即可,譬如把自己(this关键字)复制给某个变量或者对象的成员变量,那在第二次标记时它将被移除“即将回收”的集合;如果对象这时候还没有逃脱,那基本上他就真的要被回收了。值得一提的是finalize()方法的运行代价高昂,不确定性大,无法保证各个对象的调用顺序,如今已被官方声明为不推荐使用的语法。

1.5、回收方法区

方法区的垃圾收集主要回收两部分内容:废弃的常量和不再使用的类型。回收废弃常量与回收Java堆中的对象非常类似。举个常量池中字面量回收的例子,假如一个字符串“Java”层级进入常量池中,但当前系统又没有任何一个字符串对象的值是“Java”,换句话说,已经没有任何字符串对象引用常量池中的“Java”常量,且虚拟机中也没有其他地方引用这个字面量。如果在这时发生内存回收,而且垃圾收集器判断确有必要的话,这个“Java”常量就将会被系统清理出常量池。常量池中其他类(接口)、方法、字段的符号引用也与此类似。
要判定一个类型是否属于“不再被使用的类”的条件比较苛刻,需要同时满足以下三个条件:

  • 该类所有的实例都已经被回收,也就是Java堆中不存在该类及其任何派生子类的实例。
  • 加载该类的类加载器已经被回收,这个条件除非是经过精心设计的可替换类加载器的场景,如OSGi、JSP的重加载等,否则通常很难达成。
  • 该类对于的java.lang.Class对象没有在任何地方被引用,无法在任何地方通过反射访问该类的方法。
    Java虚拟机被允许堆满足以上三个条件的无用类进行回收,这里说的仅仅是“被允许”,而并不是和对象一样,没有引用了就必然回收。关于是否对类型进行回收,HotSpot虚拟机提供了-Xnoclassgc参数进行控制,还可以用-verbose:class以及-XX:+TraceClassLoading、-XX:+TraceClassUnLoading查看类加载和卸载信息,其中-verbose:class和-XX:+TraceClassLoading可以在Product版的虚拟机中使用,-XX:TraceClassUnloading参数需要在FastDebug版的虚拟机支持。
    在大量使用反射、动态代理、CGLib等字节码框架,动态生成JSP以及OSGi这类频繁自定义类加载器的场景中,通常都需要Java虚拟机具备类型卸载的能力,以保证不会对方法区在成过大的内存压力。

[参考文档] 《深入理解JVM虚拟机》