《Java并发编程的艺术》:第2章 Java并发机制的底层实现原理

前言

Java代码在编译后会变成Java字节码,字节码被类加载器加载到JVM里,JVM执行字节
码,最终需要转化为汇编指令在CPU上执行,Java中所使用的并发机制依赖于JVM的实现
CPU的指令


第二章:Java并发机制的底层实现原理

2.1 volatile的应用

volatile是轻量级synchronized,能保证共享变量的“可见性”。比synchronized使用和执行成本低,不会引起线程上下文的切换和调度。

下面先来看与其原理相关的CPU术语与说明。
《Java并发编程的艺术》:第2章 Java并发机制的底层实现原理

汇编代码中,lock前缀的指令引发了两件事情:

  1. 将当前处理器缓存行的数据写回到系统内存
  2. 这个写回内存的操作使在其他CPU里缓存了该内存地址的数据无效。

    如果对声明了volatile的变量写操作,JVM会向处理器发送一条Lock前缀的指令,将这个变量所在缓存行的数据写回到系统内存。为了保证其他处理器的缓存也是新的,实现缓存一致性协议。。每个处理器嗅探在总线上的数据检查自己缓存是否过期。当处理器发现自己缓存行对应的内存地址被修改,就会将当前缓存行设置成无效状态,会重新从系统内存中把数据读到处理器缓存里。

追加字节能优化性能?

如果队列的头节点和尾节点都不足64字节的话,处理器会将
它们都读到同一个高速缓存行中,在多处理器下每个处理器都会缓存同样的头、尾节点,当一
个处理器试图修改节点时,会将整个缓存行锁定,那么在缓存一致性机制的作用下,会导致
其他处理器不能访问自己高速缓存中的节点,而队列的入队和出队操作则需要不停修改头
节点和尾节点,所以在多处理器的情况下将会严重影响到队列的入队和出队效率。

两种场景下不该使用这种方式:
缓存行非64字节的处理器。
共享变量不会被频繁地写。


2.2 synchronized的实现原理与应用

Java的每一个对象都可以作为锁。
对于普通同步方法,锁是当前实例对象。
对于静态同步方法,锁是当前类的class对象。
对于同步方法块,锁是synchronized括号里配置的对象。
方法同步和代码块同步,两种的实现细节不一样。代码块使用monitorenter和monitorexit指令实现的。
monitorenter指令是在编译后插入到同步代码块的开始位置,而monitorexit是插入到方法结
束处和异常处。


2.2.1 Java对象头
synchronized用的锁是存在Java对象头里的。非数组类型,2Byte存对象头,数组类型3Byte。
HotSpot虚拟机中,对象在内存中存储的布局可以分为三块区域:对象头(Header)、实例数据(Instance Data)和对齐填充(Padding)。 对象头默认存储对象的HashCode(25bit),分代年龄(4bit)和锁标记位。


2.2.2 锁的升级与对比
Java SE 1.6为了减少获得锁和释放锁带来的性能消耗,引入了“偏向锁”和“轻量级锁”。1.6中,一共有4种状态,由低到高是无锁,偏向锁,轻量锁,重量锁。锁只能升级。
1.BiaseLocking
当一个线程访问同步块并获取锁时,会在对象头和栈帧中的锁记录里存储锁偏向的线程ID,以后该线程在进入和退出
同步块时不需要进行CAS操作来加锁和解锁,只需简单地测试一下对象头的Mark Word里是否
存储着指向当前线程的偏向锁。 如果测试成功,表示线程已经获得了锁。如果测试失败,则需
要再测试一下Mark Word中偏向锁的标识是否设置成1(表示当前是偏向锁):如果没有设置,则
使用CAS竞争锁;如果设置了,则尝试使用CAS将对象头的偏向锁指向当前线程

偏向锁使用了一种等到竞争出现才释放锁的机制,所以当其他线程尝试竞争偏向锁时,
持有偏向锁的线程才会释放锁。偏向锁的撤销,需要等待全局安全点(在这个时间点上没有正
在执行的字节码)。它会首先暂停拥有偏向锁的线程,然后检查持有偏向锁的线程是否活着,
如果线程不处于活动状态,则将对象头设置成无锁状态;如果线程仍然活着,拥有偏向锁的栈
会被执行,遍历偏向对象的锁记录,栈中的锁记录和对象头的Mark Word要么重新偏向于其他
线程,要么恢复到无锁或者标记对象不适合作为偏向锁,最后唤醒暂停的线程。

关闭偏向锁,程序默认进轻量级锁状态。
《Java并发编程的艺术》:第2章 Java并发机制的底层实现原理
2.轻量级锁
线程在执行同步块之前,JVM会先在当前线程的栈桢中创建用于存储锁记录的空间,并
将对象头中的Mark Word复制到锁记录中,官方称为Displaced Mark Word。然后线程尝试使用
CAS将对象头中的Mark Word替换为指向锁记录的指针。如果成功,当前线程获得锁,如果失
败,表示其他线程竞争锁,当前线程便尝试使用自旋来获取锁。

轻量级解锁时,会使用原子的CAS操作将Displaced Mark Word替换回到对象头,如果失败,表示当前锁存在竞争,锁就会膨胀成重量级锁。

《Java并发编程的艺术》:第2章 Java并发机制的底层实现原理

3.锁的优缺点:
《Java并发编程的艺术》:第2章 Java并发机制的底层实现原理


2.3 原子操作的实现原理
不可中断的一个或一系列操作。
首先处理器会自动保存“基本“的内存操作的原子性。当一个处理器读取一个字节时,其他处理器不能访问这个字节的内存地址。
但复杂的内存操作是不能自动保证其原子性的,比如跨总线宽度,跨多个缓存行和跨页表的访问。但是,处理器提供“总线锁定““缓存锁定“来保证复杂内存操作的原子性。

  1. 总线锁就是使用处理器提供的一个LOCK#信号,当一个CPU在总线输出此信号时,其他处理器的请求将被阻塞住,那么该CPU可以独占该内存。
  2. 缓存锁定是指内存区域如果被缓存在CPU的缓存行中,并且在Lock操作期间被锁定,那么当它执行锁操作回写到内存时,CPU不在总线上声明LOCK#信号,而是修改内部的内存地址,并允许它的缓存一致性机制来保证操作的原子性。因为缓存一致性机制能阻止同时修改两个以上CPU缓存的内存区域数据。

    有两种情况CPU不会使用缓存锁定:
    1 .操作的数据不能被缓存在CPU内部。或操作的数据跨多个缓存行
    2.有些处理器不支持缓存锁定

Java中如何实现原子操作

  1. 使用循环CAS实现
  2. CAS实现原子性操作的三大问题

    ABA问题:JDK1.5里,AtomicStampedReference可以解决。这个类的compareAndSet方法的作用是首先检查当前引用是否为预期引用,并检查当前标志是否为预期标志,若全部相等,以原子方式将该引用和该标志的值设置为给定的更新值。

循环时间长开销大:JVM支持处理器提供的pause指令。

只能保证一个共享变量的原子操作:对多个共享变量,循环CAS无法保证操作的原子性。一个取巧的办法,把多个共享变量合并成一个对象:i=2,j=a,合并为ij=2a。由AtomicReference支持

3.使用锁机制实现原子操作
除了偏向锁,JVM实现锁都用了循环CAS,当一个线程想进入同步块时,循环CAS获取锁,退出同步块时,循环CAS释放锁。