JVM内核-原理、诊断与优化学习笔记(二):JVM运行机制
JVM启动流程
jvm.cfg JVM配置文件
JNIEnv提供了大量的和JVM交互的一些操作,比如findClass
PC寄存器
每个线程拥有一个PC寄存器
在线程创建时 创建
指向下一条指令的地址
执行本地方法时,PC的值为undefined
方法区
注意:
JDK6时,String等常量信息置于方法区
JDK7时,已经移动到了堆
保存装载的类信息
类型的常量池
字段,方法信息
方法字节码
通常和永久区(Perm)关联在一起
永久区(Perm)保存相对静止的数据,虽然类的数据在运行的过程当中可能会出现调整,比如说热加载,如果是热加载热替换的话,显然会有一个删除然后重新加载的过程,虽然这些信息可能会发生变动,但是应用层面的软件相比是比较稳定的,这样的稳定就是永久区,但是永久区并不是永远不会变的。
Java堆
跟方法区相比,方法区是jvm来维护的,而java堆所有代码中通过new出来的对象,基本上都是在java堆当中
- 和程序开发密切相关
- 应用系统对象都保存在Java堆中
- 所有线程共享Java堆
- 对分代GC来说,堆也是分代的
- GC的主要工作区间:
eden | s0 | s1 | tenured
eden对象出生的地方,s0 s1使用复制算法,tenured老年代。
Java栈
堆是全局共享的,栈是线程私有的
- 线程私有
- 栈由一系列帧组成(因此Java栈也叫做帧栈)
- 帧保存一个方法的局部变量、操作数栈、常量池指针
- 每一次方法调用创建一个帧,并压栈
Java栈 – 局部变量表 包含参数和局部变量
public class StackDemo {
public static int runStatic(int i,long l,float f,Object o ,byte b){
return 0;
}
public int runInstance(char c,short s,boolean b){
return 0;
}
}
//runStatic静态方法的栈示意
//因为一个槽位只能容纳32位的大小,即int,所以int占了一个槽位,long(64位)占了两个槽位
//对象是引用reference(32位)
-----------------------
0 int int i
-----------------------
1 long long l
-----------------------
3 float float f
-----------------------
4 reference Object o
-----------------------
5 int byte b
-----------------------
//runInstance方法的示意
-----------------------
0 reference this
-----------------------
1 int char c
-----------------------
2 int short s
-----------------------
3 int boolean b
-----------------------
注意: runInstance和runStatic的区别是runInstance比runStatic多了一个自身的this引用。
Java栈 – 函数调用组成帧栈
public static int runStatic(int i,long l,float f,Object o ,byte b){
return runStatic(i,l,f,o,b);
}
-----------------------
0 int int i
-----------------------
1 long long l
-----------------------
3 float float f
-----------------------
4 reference Object o
-----------------------
5 int byte b
-----------------------
//上面为一个帧,省略:操作数栈、返回地址等。
-----------------------
0 int int i
-----------------------
1 long long l
-----------------------
3 float float f
-----------------------
4 reference Object o
-----------------------
5 int byte b
-----------------------
-----------------------
0 int int i
-----------------------
1 long long l
-----------------------
3 float float f
-----------------------
4 reference Object o
-----------------------
5 int byte b
-----------------------
每次方法调用就会有一个帧被压入栈,上面是一个递归调用,一直往上面压,一直到帧栈满了为止,发生溢出,方法调用结束了,帧又会自动从帧栈里面移除掉。
Java栈 – 操作数栈
Java没有寄存器,所有参数传递使用操作数栈
public static int add(int a,int b){
int c=0;
c=a+b;
return c;
}
0: iconst_0 // 0压栈
1: istore_2 // 弹出int,存放于局部变量2
2: iload_0 // 把局部变量0压栈
3: iload_1 // 局部变量1压栈
4: iadd //弹出2个变量,求和,结果压栈
5: istore_2 //弹出结果,放于局部变量2
6: iload_2 //局部变量2压栈
7: ireturn //返回
Java栈 – 栈上分配
C++ 代码示例
class BcmBasicString{ ....}
堆上分配,每次需要清理空间
public void method(){
BcmBasicString* str=new BcmBasicString; .... delete str;
}
上面的代码new是放在了堆里面,每次用完之后需要delete,如果忘记的会就会发生内存泄漏,这种错误是很难发现的。
栈上分配,函数调用完成自动清理
//声明出来的写法
public void method(){
BcmBasicString str;
....
}
java代码
public class OnStackTest {
public static void alloc(){
byte[] b=new byte[2];
b[0]=1;
}
public static void main(String[] args) {
long b=System.currentTimeMillis();
for(int i=0;i<100000000;i++){
alloc();
}
long e=System.currentTimeMillis();
System.out.println(e-b);
}
-server -Xmx10m -Xms10m
-XX:+DoEscapeAnalysis -XX:+PrintGC
这种方式运行
输出结果 5
-server -Xmx10m -Xms10m
-XX:-DoEscapeAnalysis -XX:+PrintGC
这种方式运行输出如下结果
……
[GC 3550K->478K(10240K), 0.0000977 secs]
[GC 3550K->478K(10240K), 0.0001361 secs]
[GC 3550K->478K(10240K), 0.0000963 secs]
564
说明方式一是在栈上面分配内存,方式二是在堆上分配内存,jvm内部是有相关的优化的,当数据量不是很大的时候,通过栈的方式分配,能够减小gc的压力。
总结:
- 小对象(一般几十个bytes),在没有逃逸的情况下(逃逸,即分配出来之后除了我的线程要用,其他的线程也要用的时候,因为栈是线程私有的。),可以直接分配在栈上
- 直接分配在栈上,可以自动回收,减轻GC压力(函数调用完成之后)
- 大对象或者逃逸对象无法栈上分配
栈、堆、方法区交互
小例子
JVM通过栈调用main方法,局部变量test1存放着Sample实例的引用,用过实例的引用去堆中找到Sample实例,Sample实例的相关信息在方法区中存放着。
public class AppMain
//运行时, jvm 把appmain的信息都放入方法区
{ public static void main(String[] args)
//main 方法本身放入方法区。 {
Sample test1 = new Sample( " 测试1 " );
//test1是引用,所以放到栈区里, Sample是自定义对象应该放到堆里面
Sample test2 = new Sample( " 测试2 " );
test1.printName(); test2.printName(); }
public class Sample
//运行时, jvm 把appmain的信息都放入方法区
{ private name;
//new Sample实例后, name 引用放入栈区里, name 对象放入堆里
public Sample(String name)
{ this .name = name; }
//print方法本身放入 方法区里。public void printName()
{ System.out.println(name); }
}
JVM基本结构
内存模型
- 每一个线程有一个工作内存和主存独立
这里的主存指的是堆内存,共享内存 - 工作内存存放主存中变量的值的拷贝
当数据从主内存复制到工作存储时,必须出现两个动作:第一,由主内存执行的读(read)操作;第二,由工作内存执行的相应的load操作;当数据从工作内存拷贝到主内存时,也出现两个操作:第一个,由工作内存执行的存储(store)操作;第二,由主内存执行的相应的写(write)操作
每一个操作都是原子的,即执行期间不会被中断
对于普通变量,一个线程中更新的值,不能马上反应在其他变量中
如果需要在其他线程中立即可见,需要使用 volatile 关键字
可以看到从工作内存到主存中是需要一定的时间的,所以当一个线程中更新了值的时候,不能够在其他的线程中立即可见。
volatile
public class VolatileStopThread extends Thread{
private volatile boolean stop = false;
public void stopMe(){
stop=true;
}
public void run(){
int i=0;
while(!stop){
i++;
}
System.out.println("Stop thread");
}
public static void main(String args[]) throws InterruptedException{
VolatileStopThread t=new VolatileStopThread();
t.start();
Thread.sleep(1000);
t.stopMe();
Thread.sleep(1000);
}
}
没有volatile -server 运行 无法停止
volatile 不能代替锁
一般认为volatile 比锁性能好(不绝对)
选择使用volatile的条件是:
语义是否满足应用
内存模型的几个重要概念
可见性
一个线程修改了变量,其他线程可以立即知道
保证可见性的方法
volatile
synchronized (unlock之前,写变量值回主存)
final(一旦初始化完成,其他线程就可见)
有序性
在本线程内,操作都是有序的
在线程外观察,操作都是无序的。(指令重排 或 主内存同步延时)
指令重排
线程内串行语义
写后读 a = 1;b = a; 写一个变量之后,再读这个位置。
写后写 a = 1;a = 2; 写一个变量之后,再写这个变量。
读后写 a = b;b = 1; 读一个变量之后,再写这个变量。
以上语句不可重排
编译器不考虑多线程间的语义
可重排: a=1;b=2;
指令重排 – 破坏线程间的有序性
class OrderExample {
int a = 0;
boolean flag = false;
public void writer() {
a = 1;
flag = true;
}
public void reader() {
if (flag) {
int i = a +1;
……
}
}
}
线程A首先执行writer()方法
线程B线程接着执行reader()方法
线程B在int i=a+1 是不一定能看到a已经被赋值为1
因为在writer中,两句话顺序可能打乱
线程A
flag=true
a=1
线程B
flag=true(此时a=0)
指令重排 – 保证有序性的方法
class OrderExample {
int a = 0;
boolean flag = false;
public synchronized void writer() {
a = 1;
flag = true;
}
public synchronized void reader() {
if (flag) {
int i = a +1;
……
}
}
}
同步后,即使做了writer重排,因为互斥的缘故,reader 线程看writer线程也是顺序执行的。在线程A执行完之前,线程B是进不来的。
线程A
flag=true
a=1
线程B
flag=true(此时a=1)
指令重排的基本原则
程序顺序原则:一个线程内保证语义的串行性
volatile规则:volatile变量的写,先发生于读
锁规则:解锁(unlock)必然发生在随后的加锁(lock)前
传递性:A先于B,B先于C 那么A必然先于C
线程的start方法先于它的每一个动作
线程的所有操作先于线程的终结(Thread.join())
线程的中断(interrupt())先于被中断线程的代码
对象的构造函数执行结束先于finalize()方法
编译和解释运行的概念(字节码运行的两种方式)
解释运行
解释执行以解释方式运行字节码
解释执行的意思是:读一句执行一句
编译运行(JIT–just in time)
将字节码编译成机器码
直接执行机器码
运行时编译
编译后性能有数量级的提升
编译执行和解释执行性能应该差十倍以上。