总线锁LOCK和缓存一致性协议

转发: https://blog.youkuaiyun.com/qq_35642036/article/details/82801708

  随着多核时代的到来,并发操作已经成了很正常的现象,操作系统必须要有一些机制和原语,以保证某些基本操作的原子性,比如处理器需要保证读一个字节或写一个字节是原子的,那么它是如何实现的呢?有两种机制:总线锁定和缓存一致性。

       我们知道,CPU和物理内存之间的通信速度远慢于CPU的处理速度,所以CPU有自己的内部缓存,根据一些规则将内存中的数据读取到内部缓存中来,以加快频繁读取的速度。我们假设在一台PC上只有一个CPU和一份内部缓存,那么所有进程和线程看到的数都是缓存里的数,不会存在问题;但现在服务器通常是多 CPU,更普遍的是,每块CPU里有多个内核,而每个内核都维护了自己的缓存,那么这时候多线程并发就会存在缓存不一致性,这会导致严重问题。

       以 i++为例,i的初始值是0.那么在开始每块缓存都存储了i的值0,当第一块内核做i++的时候,其缓存中的值变成了1,即使马上回写到主内存,那么在回写之后第二块内核缓存中的i值依然是0,其执行i++,回写到内存就会覆盖第一块内核的操作,使得最终的结果是1,而不是预期中的2.

       那么怎么解决整个问题呢?操作系统提供了总线锁定的机制。前端总线(也叫CPU总线)是所有CPU与芯片组连接的主干道,负责CPU与外界所有部件的通信,包括高速缓存、内存、北桥,其控制总线向各个部件发送控制信号、通过地址总线发送地址信号指定其要访问的部件、通过数据总线双向传输。在CPU1要做 i++操作的时候,其在总线上发出一个LOCK#信号,其他处理器就不能操作缓存了该共享变量内存地址的缓存,也就是阻塞了其他CPU,使该处理器可以独享此共享内存。

        但我们只需要对此共享变量的操作是原子就可以了,而总线锁定把CPU和内存的通信给锁住了,使得在锁定期间,其他处理器不能操作其他内存地址的数据,从而开销较大,所以后来的CPU都提供了缓存一致性机制,Intel的奔腾486之后就提供了这种优化。

缓存一致性:缓存一致性机制就整体来说,是当某块CPU对缓存中的数据进行操作了之后,就通知其他CPU放弃储存在它们内部的缓存,或者从主内存中重新读取,用MESI阐述原理如下:

MESI协议:是以缓存行(缓存的基本数据单位,在Intel的CPU上一般是64字节)的几个状态来命名的(全名是Modified、Exclusive、 Share or Invalid)。该协议要求在每个缓存行上维护两个状态位,使得每个数据单位可能处于M、E、S和I这四种状态之一,各种状态含义如下:

       M:被修改的。处于这一状态的数据,只在本CPU中有缓存数据,而其他CPU中没有。同时其状态相对于内存中的值来说,是已经被修改的,且没有更新到内存中。
        E:独占的。处于这一状态的数据,只有在本CPU中有缓存,且其数据没有修改,即与内存中一致。
        S:共享的。处于这一状态的数据在多个CPU中都有缓存,且与内存一致。
        I:无效的。本CPU中的这份缓存已经无效。

     一个处于M状态的缓存行,必须时刻监听所有试图读取该缓存行对应的主存地址的操作,如果监听到,则必须在此操作执行前把其缓存行中的数据写回CPU。
        一个处于S状态的缓存行,必须时刻监听使该缓存行无效或者独享该缓存行的请求,如果监听到,则必须把其缓存行状态设置为I。
        一个处于E状态的缓存行,必须时刻监听其他试图读取该缓存行对应的主存地址的操作,如果监听到,则必须把其缓存行状态设置为S。

       当CPU需要读取数据时,如果其缓存行的状态是I的,则需要从内存中读取,并把自己状态变成S,如果不是I,则可以直接读取缓存中的值,但在此之前,必须要等待其他CPU的监听结果,如其他CPU也有该数据的缓存且状态是M,则需要等待其把缓存更新到内存之后,再读取。

       当CPU需要写数据时,只有在其缓存行是M或者E的时候才能执行,否则需要发出特殊的RFO指令(Read Or Ownership,这是一种总线事务),通知其他CPU置缓存无效(I),这种情况下性能开销是相对较大的。在写入完成后,修改其缓存状态为M。

       所以如果一个变量在某段时间只被一个线程频繁地修改,则使用其内部缓存就完全可以办到,不涉及到总线事务,如果缓存一会被这个CPU独占、一会被那个CPU 独占,这时才会不断产生RFO指令影响到并发性能。这里说的缓存频繁被独占并不是指线程越多越容易触发,而是这里的CPU协调机制,这有点类似于有时多线程并不一定提高效率,原因是线程挂起、调度的开销比执行任务的开销还要大,这里的多CPU也是一样,如果在CPU间调度不合理,也会形成RFO指令的开销比任务开销还要大。当然,这不是编程者需要考虑的事,操作系统会有相应的内存地址的相关判断

       并非所有情况都会使用缓存一致性的,如被操作的数据不能被缓存在CPU内部或操作数据跨越多个缓存行(状态无法标识),则处理器会调用总线锁定;另外当CPU不支持缓存锁定时,自然也只能用总线锁定了,比如说奔腾486以及更老的CPU。
--------------------- 
作者:Chackca 
来源:优快云 
原文:https://blog.youkuaiyun.com/qq_35642036/article/details/82801708 
版权声明:本文为博主原创文章,转载请附上博文链接!

### 如何确保指令缓存与数据缓存的一致性 在现代计算机体系结构中,CPU 的缓存被分为指令缓存数据缓存两种主要形式。由于多核处理器的存在以及复杂的内存层次架构,保持这两种缓存之间的一致性成为了一个重要的挑战。以下是几种常见的解决方案: #### 1. **MESI 协议** MESI 是一种经典的缓存一致性协议,广泛应用于多核处理器中。它定义了四种状态:Modified (M),Exclusive (E),Shared (S),Invalid (I)。当多个核心试图读写同一份数据时,MESI 协议会通过总线嗅探或其他通信方式协调这些操作,从而保证所有缓存副本之间的数据一致性[^2]。 对于指令缓存数据缓存而言,MESI 可以扩展为更复杂的形式(如 MOESI 或 MESIF)。在这种情况下,不仅需要跟踪数据的状态变化,还需要考虑指令流的变化,尤其是在 JIT 编译器动态生成代码的情况下。 #### 2. **硬件支持的缓存刷新机制** 许多现代 CPU 架构提供了专门的指令用于显式地刷新或同步缓存内容。例如,在 x86 平台上可以使用 `CLFLUSH` 指令清除指定地址范围内的缓存行[^1]。这种方法通常适用于那些对性能敏感的应用场景,比如操作系统内核或者实时嵌入式系统开发。 另外还有全全局刷除命令(WBINVD INVD),它们会强制清空整个 L1/L2 高速缓冲区并将其内容回写至较低级别的存储设备上直到 DRAM 层级为止。尽管如此频繁调用此类功能可能会带来显著开销因此应该谨慎对待仅限必要时刻才启用。 #### 3. **软件层面的事务管理** 除了依赖纯物理层面上的技术手段外还可以借助高级编程模型实现逻辑上的隔离保护措施来间接达成目标效果比如说采用乐观悲观相结合的方式处理并发冲突问题;或者是引入版本号标记法每当发生任何改动都会相应增加一个新的修订编号以便后续验证时候能够快速判断是否存在差异进而采取适当行动恢复原始状态或者重新加载最新可用资源实例等等[^3]. ```python import threading class CacheManager: _lock = threading.Lock() @staticmethod def update_cache(key, value): with CacheManager._lock: # 使用互斥防止竞争条件 cache[key] = value def worker(): while True: key_to_update = get_next_key() new_value = compute_new_value_for_key(key_to_update) CacheManager.update_cache(key_to_update,new_value) threads=[threading.Thread(target=worker)for i in range(5)] for t in threads:t.start();t.join(); ``` 上述例子展示了如何利用 Python 中的标准库模块创建一个多线程环境下的安全共享字典对象作为模拟缓存容器并通过加机制避免潜在的风险隐患. ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值