一、JMM与happen-before

1.1 为什么会存在“内存可见性”问题

下图为x86架构下CPU缓存的布局，即在一个CPU 4核下，L1、L2、L3三级缓存与主内存的布局。每个核上面有L1、L2缓存，L3缓存为所有核共用。

Untitled

因为存在CPU缓存一致性协议，例如MESI，多个CPU核心之间缓存不会出现不同步的问题，不会有 “内存可见性”问题。缓存一致性协议对性能有很大损耗，为了解决这个问题，又进行了各种优化。例如，在计算单元和 L1之间加了Store Buffer、Load Buffer（还有其他各种Buffer），如下图：

Untitled

L1、L2、L3和主内存之间是同步的，有缓存一致性协议的保证，但是Store Buffer、Load Buffer和 L1之间却是异步的。向内存中写入一个变量，这个变量会保存在Store Buffer里面，稍后才异步地写入L1中，同时同步写入主内存中。操作系统内核视角下的CPU缓存模型：

Untitled

多CPU，每个CPU多核，每个核上面可能还有多个硬件线程，对于操作系统来讲，就相当于一个个的逻辑CPU。每个逻辑CPU都有自己的缓存，这些缓存和主内存之间不是完全同步的。对应到Java里，就是JVM抽象内存模型，如下图所示：

Untitled

1.2 重排序与内存可见性的关系

**Store Buffer的延迟写入是重排序的一种，称为内存重排序（Memory Ordering）。**除此之外，还有编译器和CPU的指令重排序。重排序类型：

编译器重排序。 对于没有先后依赖关系的语句，编译器可以重新调整语句的执行顺序。
CPU指令重排序。 在指令级别，让没有依赖关系的多条指令并行。
CPU内存重排序。 CPU有自己的缓存，指令的执行顺序和写入主内存的顺序不完全一致。

在三种重排序中，第三类就是造成“内存可见性”问题的主因，如下案例：

线程1： X=1 a=Y 线程2： Y=1 b=X 假设X、Y是两个全局变量，初始的时候，X=0，Y=0。请问，这两个线程执行完毕之后，a、b的正确结果应该是什么？很显然，线程1和线程2的执行先后顺序是不确定的，可能顺序执行，也可能交叉执行，最终正确的结果可能是：

a=0,b=1
a=1,b=0