在前面内存系统重排序提到,“写缓存没有及时刷新到内存,导致不同处理器缓存的值不一样”,出现这种情况是糟糕的,所幸处理器遵循缓存一致性协议能够保证足够的可见性又不过多的损失性能。
缓存一致性协议给缓存行(通常为64字节)定义了个状态:独占(exclusive)、共享(share)、修改(modified)、失效(invalid),用来描述该缓存行是否被多处理器共享、是否修改。所以缓存一致性协议也称MESI协议。
处理修改状态是比较耗时的操作,既要发送失效消息给其他拥有者并写回主存,还要等待其他拥有者处理失效信息,直到收到失效消息的响应。如果在这一段时间,处理器都处于空等,那是奢侈的。所以引入缓存和失效缓存来让处理器不再“等”。
存储缓存(Store Buffers),也就是常说的写缓存,当处理器修改缓存时,把新值放到存储缓存中,处理器就可以去干别的事了,把剩下的事交给存储缓存。
处理失效的缓存也不是简单的,需要读取主存。并且存储缓存也不是无限大的,那么当存储缓存满的时候,处理器还是要等待失效响应的。为了解决上面两个问题,引进了失效队列(invalidate queue0)。
处理失效的工作如下:
下面是处理器A、B,依次写、读内存a的时序图。A、B都缓存了a。
可以看到即使遵守缓存一致性协议,也会有一段时间缓存不一致(①-⑥)。
要是读取a的操作在这段时间内,那么处理器B看到的a将是0。处理器执行顺序为写a>读a,而在内存上的顺序为读a>写a,造成了重排序。重排序可能会导致不可见性,要是此时线程A、B分别在处理器A、B上执行,那么线程A执行了写操作后,线程B看不到线程A执行的结果,共享内存a不可见,改变了程序运行结果。
引发重排序是糟糕的,可能造成共享内存不可见,改变程序结果。那么该怎么办,不进行MESI优化吗?既不能追求性能,造成重排序,也不能追求可见性(非共享数据可见是不需要的),降低性能。
处理器还是使用提供了个武器——内存屏障指令(Memory Barrier):
可以看到内存屏障可以阻止内存系统重排序,保证可见性。但其开销也很大,处理器需要阻塞等待,一般应用在锁的获取和释放中。
上面那段处理器A、B,依次写、读内存a,加了内存屏障后,就不会被重排序了。
boolean finish = false;
int a = 0;
//处理器A:
a = 1;
storeMemoryBarrer(); //保证a一定在主存中,且处理器B中a为invlid
finish = true;
//处理器B:
while(!finish);
loadMemoryBarrier(); //保证缓存到a最新的值,执行后a为share
assert a == 1;
为了更好的理解如何实现同步的可见性,JMM抽象出了内存屏障Memory Barrier。