基本概念

线程通信与同步机制

在并发编程中 我们 需要处理两个关键问题:线程之间如何通信及线程之间如何同步? 这里的线程是指并发执行的活动实体 。 通信是指线程之间以何种机制来交换信息。 在命令式编程中, 线程之间的通信机制有两种:共享内存和消息传递。
  1. 在共享内存的并发模型里,线程之间共享程序的公共状态线程之间通过写读内存中的公共状态来隐式进行通信。
  1. 在消息传递的并发模型里,线程之间没有公共状态 ,线程之间必须通过明确的发送消息来显式进行通信 。同步是指程序用于控制不同线程之间操作发生相对顺序的机制。
在共享内存并发模型里,同步是显式进行的。程序员 必须显式指定某个方法或某段代码 需要在线程 之间互斥执行。
在消息传递的并发模型里,由于消息的发送必须在消息的接收之前,因此同步是隐式进行的。
 
Java的并发采用的是共享内存模型。
Java线程间的通信总是隐式进,行整个通信过程对程序员完全透明 。
如果编写多线程程序的Java程序员不理解 隐式进行的线程之间通信的工作机制很可能会遇到各种奇怪的内存可见性问题。

Java 内存模型的抽象

Java线程之间的通信由 Java 内存模型JMM控制。 JMM 决定一个线程对共享变量的写入何时对另一个线程可见。
从抽象的角度来看,JMM 定义了线程和主内存之间的抽象关系:线程之间的共享变量存储在主内存(main memory)中,每个线程都有一个私有的本地内存(local memory),本地内存中存储了该线程以读/写共享变量的副本。
本地内存是 JMM 的一个抽象概念,并不真实存在。它涵盖了缓存,写缓冲区,寄存器以及其他的硬件和编译器优化
从抽象的角度来看, JMM 定义了线程和主内存之间的抽象关系: 线程之间的共享变量存储在主内存 main memory中,每个线程都有一个私有的本地内存(每个线程都有一个私有的本地内存(local memory),本地内存中存储了该线程以读/ 写共享变量的副本。
本地内存是JMM的的一个抽象概念,并不真实存在。它涵盖了缓存,写缓冲区,寄存器以及其他的硬件和编译器优化。Java 内存模型的抽象示意图如下:
notion image
从上图来看,线程 A 与线程 B 之间如要通信的话,必须要经历下面 2 个步骤:
  1. 首先,线程 A 把本地内存 A 中更新过的共享变量刷新到主内存中去。
  1. 然后,线程 B 到主内存中去读取线程 A 之前已更新过的共享变量。下面通过示意图来说明这两个步骤:
notion image
如上图所示,本地内存 A 和 B 有主内存中共享变量 x 的副本。
假设初始时,这三个内存中的 x 值都为 0。线程 A 在执行时,把更新后的 x 值(假设值为 1)临时存放在自己的本地内存 A 中。
当线程 A 和线程 B 需要通信时,线程 A 首先会把自己本地内存中修改后的 x 值刷新到主内存中,此时主内存中的 x 值变为了 1。
随后,线程 B 到主内存中去读取线程 A 更新后的 x 值,此时线程 B 的本地内存的 x 值也变为了 1。
从整体来看,这两个步骤实质上是线程 A 在向线程 B 发送消息,而且这个通信过程必须要经过主内存。JMM 通过控制主内存与每个线程的本地内存之间的交互,来为 java 程序员提供内存可见性保证。

重排序分类

在执行程序时为了提高性能,编译器和处理器常常会对指令做重排序。重排序分三种类型:
  1. 编译器优化的重排序。编译器在不改变单线程程序语义的前提下,可以重新安排语句的执行顺序。
  1. 指令级并行的重排序。现代处理器采用了指令级并行技术(Instruction-Level Parallelism, ILP)来将多条指令重叠执行。如果不存在数据依赖性,处理器可以改变语句对应机器指令的执行顺序。
  1. 内存系统的重排序。由于处理器使用缓存和读/写缓冲区,这使得加载和存储操作看上去可能是在乱序执行。
从java 源代码到最终实际执行的指令序列,会分别经历 下面 三种重排序:
notion image
上述的 1 属于编译器重排序,2 和 3 属于处理器重排序。这些重排序都可能会导致多线程程序出现内存可见性问题。对于编译器,JMM 的编译器重排序规则会禁止特定类型的编译器重排序(不是所有的编译器重排序都要禁止)。
对于处理器重排序,JMM 的处理器重排序规则会要求 java 编译器在生成指令序列时,插入特定类型的内存屏障(memory barriers,intel 称之为 memory fence)指令,通过内存屏障指令来禁止特定类型的处理器重排序(不是所有的处理器重排序都要禁止)。JMM 属于语言级的内存模型,它确保在不同的编译器和不同的处理器平台之上, 通过禁止特定类型的编译器重排序和处理器重排序,为程序员提供一致的内存可见性保证。
 
JMM 体现在以下几个方面
  1. 原子性 - 保证指令不会受到线程上下文切换的影响
  1. 可见性 - 保证指令不会受 cpu 缓存的影响
  1. 有序性 - 保证指令不会受 cpu 指令并行优化的影响

内存间交互操作

关于主内存与工作内存之间具体的交互协议,即一个变量如何从主内存拷贝到工作内存,如何从工作内存同步回主内存之类的实现细节,java内存模型定义8种操作来完成
  • lock(锁定):作用于主内存的变量,它把一个变量标识为一条线程独占的状态
  • unlock(解锁):作用于主内存的变量,它把一个处于锁定状态的变量释放出来,释放后的变量才可以被其他线程锁定
  • read(读取):作用于主内存的变量,它把一个变量的值从主内存传输到线程的工作内存中
  • load(载入):作用于工作内存的变量,它把read操作从主内存中得到的变量值放入工作内存的变量副本中
  • use(使用):作用于工作内存的变量,它把工作内存中一个变量的值传递给执行引擎,每当虚拟机遇到一个需要使用变量的字节码指令时将会执行这个操作
  • assign(赋值):作用于工作内存的变量,它把一个从执行引擎接收到的值赋值给工作内存的变量,每当虚拟机遇到一个需要给变量赋值的字节码指令时将会执行这个操作
  • store(存储):作用于工作内存的变量,它把工作内存中一个变量的值传送到主内存中,以便随后的write操作使用
  • write(写入):作用于主内存的变量:它把store操作从工作内存中得到的变量的值放入到主内存的变量中