JVM性能优化实战
类加载机制
类生命周期
类加载器
类加载器负责装入类,搜索网络、jar、zip、文件夹、二进制数据、内存等指定位置的类资源。一个java程序运行,最少有三个类加载器实例,负责不同类的加载。
查看类对应的加载器
通过JDK-API进行查看:java.lang.Class.getClassLoader()
,返回装载类的类加载器。如果这个类是由bootstrapClassLoader加载的,那么这个方法在这种实现中将返回null。
JVM如何知道类在哪里
class信息存放在不同的位置,桌面jar、项目bin目录、target目录等等…
查看openjdk源码:sun.misc.Launcher.AppClassLoader
,结论:读取java.class.path
配置,指定去哪些地址加载类资源。
验证过程:利用jps、jcmd两个命令:
- jps查看本机JAVA进程;
- 查看运行时配置:jcmd 进程号
VM.system_properties
类不会重复加载
类的唯一性:同一个类加载器,类名一样,代表是同一个类。
- 识别方式: ClassLoader Instance id + PackageName + ClassName
- 验证方式: 使用类加载器,对同一个class类的不同版本,进行多次加载,检查是否会加载到最新的代码。
类的卸载
满足两个条件:
- 该Class所有的实例都已经被GC;
- 加载该类的ClassLoader实例已经被GC;
验证方式:jvm启动中增加-verbose:class
参数,输出类加载和卸载的日志信息。
双亲委派模型
为了避免重复加载,由下到上逐级委托,由上到下逐级查找。
首先不会自己去尝试加载类,而是把这个请求委派给父类加载器去完成;每一个层次的加载器都是如此,因此所有的类加载请求都会传给上层的启动类加载器。
只有当父加载器反馈自己无法完成该加载请求(该加载器的搜索范围中没有找到对应的类)时,子加载器才会尝试自己去加载。
注:类加载器之间不存在父类子类的关系,"双亲"是翻译,可以理解为逻辑上定义的上下级关系。
垃圾回收机制
自动垃圾收集
自动垃圾收集是查看堆内存,识别正在使用哪些对象以及哪些对象未被删除以及删除未使用对象的过程。
使用中的对象或引用的对象以为着程序的某些部分仍然维护指向该对象的指针。程序的任何部分都不再引用未使用的对象或未引用的对象,因此可以回收未引用对象使用的内存。
像C这样的编程语言中,分配和释放内存是一个手动过程。在Java中,接触分配内存的过程由垃圾收集器自动处理。
如何确定内存需要被回收
该过程的第一步称为标记。这是垃圾收集器识别哪些内存正在使用而哪些不在使用的地方。
不同类型内存的判断方式
- 对象回收——引用计数
- 对象回收——可达性分析
- 方法区回收
可达性分析算法
简单来说,将对象及其引用关系看作一个图,选定活动的对象作为GC Roots;然后跟踪引用链条,如果一个对象和GC Roots之间不可达,也就是不存在引用,那么即可认为是可回收对象。
可以作为GC Root的对象:
- 虚拟机栈中正在引用的对象。
- 本地方法栈中正在引用的对象。
- 静态属性引用的对象。
- 方法区常量引用的对象。
引用类型和可达性级别
引用类型
-
强引用(Strong Reference):最常见的普通对象引用,只要还有强引用指向一个对象,就不会回收。
-
软引用(Soft Reference): JVM认为内存不足时,才会去试图回收软引用指向的对象。(缓存场景)
-
弱引用(Weak Reference): 虽然是引用,但随时可能被回收掉。
-
虚引用(Phantom Reference):不能通过它访问对象。供了对象被finalize以后,执行指定逻辑的机制(Cleaner)
可达性级别
- 强可达(Strongly Reachable):一个对象可以有一个或多个线程可以不通过各种引用访问到的情况。
- 软可达(Softly Reachable):就是当我们只能通过软引用才能访问到对象的状态。
- 弱可达(Weakly Reachable):只能通过弱引用访问时的状态。当弱引用被清除的时候,就符合销毁条件。
- 幻象可达(Phantom Reachable):不存在其他引用,并且finalize过了,只有幻象引用指向这个对象。
- 不可达(unreachable): 意味着对象可以被清除了。
垃圾收集算法
标记 - 清除(Mark-Sweep)算法: 首先标识出所有要回收的对象,然后进行清除。标记、清除过程效率有限,有内存碎片化问题,不适合特别大的堆;收集算法基本基于标记-清除的思路进行改进。
复制(Copying)算法: 划分两块同等大小的区域,收集时将活着的对象复制到另一块区域。拷贝过程中将对象顺序放置,就可以避免内存碎片化。复制+预留内存,有一定的浪费。
标记 - 整理(Mark-Compact): 类似于标记 - 清除,但为避免内存碎片化,它会在清理过程中将对象移动,以确保移动后的对象占用连续的内存空间。
分代收集
根据对象的存货周期,将内存划分为几个区域,不同区域采用合适的垃圾收集算法。
新对象会分配到Eden,如果超过 -XX:+PretenureSizeThreshold:
设置大对象直接进入老年代的阙值。
minor GC一定次数未回收对象移动到老年代-XX:MaxTenuringThreshold
。
新生代 S0 :S1 :Eden—>1 :1 :8 新生代:老年代—>1: 2
垃圾收集器
串行收集器:Serial GC -XX:+UseSerialGC
单个线程来执行所有垃圾收集工作,适合单处理器机器。Client模式下JVM的默认选项。
串行收集器:Serial Old -XX:+UseSerialOldGC
可以在老年代使用,它采用了标记-整理(Mark-Compact) 算法,区别于新生代的复制算法。
并行收集器: Parallel GC -XX:+UseParallelGC;并行收集器:Parallel Old GC -XX:+UseParallelOldGC
server模式JVM的默认GC选择,整体算法和Serial比较相似,区别是新生代和老年代GC都是并行进行;可以设置GC时间或吞吐量等值,可以自动进行适应性调整Eden,Survivor大小和MaxTenuringThreshold的值。
也称为吞吐量优先的GC:吞吐量=用户代码运行时间/ (用户代码运行时间+ GC时间)
-
-XX:ParallelGCThreads:
设置用于垃圾回收的线程数。通常情况下可以和CPU数量相等。 -
-XX:MaxGCPauseMills:
设置最大垃圾收集停顿时间。它的值是一个大于0的整数。 -
-XX:GCTimeRatio:
设置吞吐量大小,它的值是一个0-100之间的整数。 -
-XX:+UseAdaptiveSizePolicy:
打开自适应GC策略。以达到在堆大小、吞吐量和停顿时间之间的平衡点。
并发收集器: CMS (Concurrent Mark Sweep) GC -XX:+UseConcMarkSweepGC
专用老年代,基于标记-清除(Mark-Sweep) 算法,设计目标是尽量减少停顿时间。采用的标记-清除算法,存在着内存碎片化问题,长时间运行等情况下发生full GC,导致恶劣的停顿。
CMS会占用更多CPU资源,并和用户线程争抢。减少了停顿时间,这一点对于互联网web等对时间敏感的系统非常重要,一直到今天,仍然有很多系统使用CMSGC。
并行收集器-:ParNew GC -XX:+UseParNewGC
新生代GC实现,它实际是Serial GC的多线程版本。可以控制线程数量,参数: -XX:ParallelGCThreads
最常见的应用场景是配合老年代的CMS GC工作。参数-XX:+UseConcMarkSweepGC
并发收集器:G1 -XX:+UseG1GC
针对大堆内存设计的收集器,兼顾吞吐量和停顿时间,JDK9后为默认选型,目标是替代CMS;G1将堆分成固定大小的区域,Region之间是复制算法;但整体止实际可看作是标记-整理(MarkCompact) 算法,可以有效地避免内存碎片。找不到大内存时执行FullGC。
JDK内置命令工具
JDK内置工具 - javap
java反编译工具,主要用于根据Java字节码文件反汇编为Java源代码文件。javap <options><classes>
参数 | 作用 |
---|---|
javap -version |
版本信息 |
javap -help --help -? |
输出此用法消息 |
javap -v-verbose |
输出附加信息 |
javap-l |
17.09 |
javap -public |
仅显示公共类和成员 |
javap -protected |
显示受保护的/公共类和成员 |
javap -package |
显示程序包/受保护的/公共类和成员(默认) |
javap -p -private |
显示所有类和成员 |
javap -c |
对代码进行反汇编 |
javap -s |
输出内部类型签名 |
javap -sysinfo |
显示正在处理的类的系统信息(路径,大小,日期,MD5散列) |
javap -constants |
显示静态最终常量 |
javap -classpath<path> |
指定查找用户类文件的位置 |
javap -bootclasspath <path> |
覆盖引导类文件的位置 |
JDK内置工具 - jps
jps(Java Virtual Machine Process Status Tool)显示当前所有java进程pid的命令 jps [options] [ hostid ]
参数 | 作用 |
---|---|
jps -q |
仅输出VM标识符,不包括classname,,jar,name,arguments in main method |
jps -m |
输出main method的参数 |
jps -l |
输出完全的包名,应用主类名,jar的完全路径名 |
jps -v |
输出jvm参数 |
jps -V |
输出通过flag文件传递到JVM中的参数(.hotspotrc文件或-XX:Flags=所指定的文件 |
jps -Joption |
传递参数到vm,例如:-J-Xms512m |
JDK内置工具 - jstat
jstat监视Java虚拟机(JVM) 统计信息
用法:jstat [ generalOption | outputOptions vmid [interval[s|ms] [count]]
-t参数 可以在输出信息前面加上一个Timestamp列,显示程序运行的时间。
-h参数 可以在周期性的数据输出时输出多少行数据后,跟着输出一个表头信息。
interval 指定输出统计周期,count指定输出多少次数据。
参数 | 作用 |
---|---|
jstat -gc pid |
显示gc的信息,查看gc的次数及时间 |
jstat -gccapacity pid |
内存GC分区中各对象的使用和占用大小 |
jstat -gcutil pid |
统计gc信息统计 |
jstat -gcnew pid |
年轻代对象的信息 |
jstat -gcnewcapacity pid |
年轻代对象的信息及其占用量 |
jstat -gcold pid old |
old代对象的信息 |
jstat -gcoldcapacity pid old |
代对象的信息及其占用量 |
jstat -gcpermcapacity pid perm |
对象的信息及其占用量 |
jstat -class pid |
显示加载class的数量,及所占空间等信息 |
jstat -compiler pid |
显示VM实时编译的数量等信息 |
jstat -printcompilation pid |
当前VM执行的信息 |
JDK内置工具 - jcmd
jcmd工具,可代替jps工具查看本地的jvm信息。
参数 | 作用 |
---|---|
jcmd |
查看本地的java进程列表,获取其pid |
jcmd pid help |
查看其支持的命令列表 |
jcmd pid Thread.print -l |
打印线程栈 |
jcmd pid VM.command_ line |
打印启动命令及参数 |
jcmd pid GC.heap_dump /data/filename.dump |
查看JVM的Heap Dump |
jcmd pid GC.class_histogram |
查看类的统计信息 |
jcmd pid VM.system_ properties |
查看系统属性内容 |
jcmd pid VM.uptime |
查看虚拟机启动时间 |
jcmd pid PerfCounter.print |
查看性能统计 |
JVM参数及调优
基本概念
在调整性能时,JVM有三个组件:
- 堆大小调整;
- 垃圾收集器调整;
- JIT编译器
大多数调优选项都与调整堆大小和为您的情况选择对合适的垃圾收集器有关。JIT编译器对性能也有很大影响,但很少需要使用较新版本的JVM进行调优。
通常,在调优Java应用程序时,重点是以下两个主要目标之一:
- 响应性:应用程序或系统对请求的数据进行响应的速度,对于专注于响应性的应用程序,长的暂停时间是不可接受的,重点是在短时间内做出回应。
- 吞吐量:侧重于在特定时间段内最大化应用程序的工作量,对于专注于吞吐量的应用程序,高暂停时间是可接受的。由于高吞吐量应用程序在较长时间内专注于基准测试,因此不需要考虑快速响应时间。
系统瓶颈核心还是咋应用代码,一般情况下无需过多调优,JVM本身在不断优化
常用JVM参数
参数 | 作用 |
---|---|
-XX:+AlwaysPreTouch |
jvm启动时分配内存,非使用时再分配 |
-XX: ErrorFile = filename |
崩溃日志 |
-XX:+TraceClassLoading |
跟踪类加载信息 |
-XX:+PrintClassHistogram |
按下Ctrl+Break后,打印类的信息 |
Xmx -Xms |
最大堆和最小堆 |
-xx:permSize、-xx:metaspaceSize |
永久代/元数据空间 |
-XX:+HeapDumpOnOutOfMemoryError |
OOM时导出堆到文件 |
-XX:+HeapDumpPath |
OOM时堆导出的路径 |
-XX:OnOutOfMemoryError |
在OOM时,执行一个脚本 |
java -XX:+PrintFlagsFinal -version |
打印所有的-XX参数和默认值 |
JVM参数和具体说明,建议需要的时候参考oracle官网的手册
GC调优思路
- 分析场景——例如:启动速度慢;偶尔出现响应慢于平均水平或者出现卡顿。
- 确定目标——内存占用、低延时、吞吐量。
- 收集日志——通过参数配置收集GC日志;通过JDK工具查看GC状态
- 分析日志——使用工具辅助分析日志,查看GC次数,GC时间
- 调整参数——切换垃圾收集器或者调整垃圾收集器参数
通用GC参数
参数 | 作用 |
---|---|
-XX:ParallelGCThreads |
并行GC线程数量 |
-XX:ConcGCThreads |
并发GC线程数量 |
-XX:MaxGCPauseMillis |
最大停顿时间,单位毫秒;GC尽力保证回收时间不超过设定值 |
-XX:GCTimeRatio |
0-100的取值范围;垃圾收集时间占总时间的比;默认99,即最大允许1%时间做GC |
-XX:SurvivorRatio |
设置Eden区大小和Survivor区大小的比例;8 表示两个Survivor :Eden=2: 8,即一个Survivor占年轻代的1/10 |
-XX:NewRatio |
新生代和老年代的比;4 表示新生代:老年代=1: 4,即年轻代占堆的1/5 |
-verbose:gc、-XX:+printGC |
打印GC的简要信息 |
-XX:+PrintGCDetails |
打印GC详细信息 |
-XX:+PrintGCTimeStamps |
打印CG发生的时间戳 |
-Xloggc:log/gc.log |
指定GC log的位置,以文件输出 |
-XX:+PrintHeapAtGC |
每次一次GC后,都打印堆信息 |
垃圾收集器CMS参数调优
- 响应时间优先
- Parallel GC无法满足应用程序延迟要求时再考虑使用CMS垃圾收集器
- 新版本建议用G1垃圾收集器
参数 | 作用 |
---|---|
-XX:+UseConcMarkSweepGC |
新生代使用并行收集器,老年代使用CMS+串行收集器 |
-XX:+UseParNewGC |
在新生代使用并行收集器CMS下默认开启 |
-XX:CMSInitiatingOccupancyFraction |
设置触发GC的阈值默认68%;如果不幸内存预留空间不够,就会引起concurrent mode failure |
-XX:+ UseCMSCompactAtFullCollection |
FullGC后,进行一次整理;整理过程是独占的,会引起停顿时间变长 |
-XX:+CMSFullGCsBeforeCompaction |
设置进行几次FullGC后,进行一次碎片整理 |
XX:+CMSClassUnloadingEnabled |
允许对类元数据进行回收 |
-XX:+UseCMSInitiatingOccupancyOnly |
表示只在到达阀值的时候,才进行CMS回收 |
XX:+CMSIncrementalMode |
使用增量模式,比较适合单CPU |
垃圾收集器G1参数调优
- 兼顾吞吐量和响应时间
- 超过50%的Java堆被实时数据占用。
- 建议大堆(大小约为6 GB或更大)
- 且GC延迟要求有限的应用(稳定且可预测的暂停时间低于0.5秒)
参数 | 作用 |
---|---|
-XX:G1HeapRegionSize=<N,例如16>M |
设置region大小,默认heap/2000 |
-XX:G1MixedGCL iveThresholdPercent |
老年代依靠Mixed GC,触发阈值 |
-XX:G1OldCSetRegionThresholdPercent |
定多被包含在一次Mixed GC中的region比例 |
-XX:+ClassUnloadingWithConcurrentMark |
G1增加并默认开启,在并发标记阶段结束后,JVM即进行类型卸载。 |
-XX:G1NewSizePercent |
新生代的最小比例 |
-XX:G1MaxNewSizePercent |
新生代的最大比例 |
-XX:G1MixedGCCountTarget |
Mixed GC数量控制 |
运行时JIT编译器优化参数
JIT编译指的是字节码编译为本地代码(汇编)执行,只有热点代码才会编译为本地代码。解释器执行节约内存,反之可以使用编译执行来提高效率。
参数 | 作用 |
---|---|
-XX:+AggressiveOpts |
允许jvm使用积极的性能优化功能 |
-XX:-TieredCompilation |
分层编译jdk 8默认开启,jdk 7默认关闭client |
-Xmaxjitcodesize、-XX:ReservedCodeCacheSize |
指定JIT编译代码的最大代码高速缓存最大值 |
-Xmixed |
除了热方法之外,解释器执行所有字节码,热方法被编译为本机代码 |
-XX:InitialCodeCacheSize |
初始化编译后的汇编指令,缓存区大小,字节 |
-XX:+PrintCompilation |
打开编译日志;jstat -compiler pid |
-XX:CICompilerCount |
JIT编译所使用的线程数量 |
-XX:+DoEscapeAnalysis |
逃逸分析,默认打开。对代码的深度优化 |
-XX:-Inline |
方法内联,默认打开。 |
很少需要对新版本的JVM进行JIT调优