存储器的层次结构

最新推荐文章于 2024-12-23 12:56:11 发布

原创最新推荐文章于 2024-12-23 12:56:11 发布 · 175 阅读

0 ·

CC 4.0 BY-SA版权

底层知识专栏收录该内容

5 篇文章

订阅专栏

本文详细介绍了多核CPU缓存的层级结构，包括从寄存器到主存的不同访问延迟，并探讨了Intel Mesi缓存一致性协议的工作原理。此外，还讨论了缓存行对齐的重要性及其在JDK中的应用，以及合并写技术和非统一内存访问(UMA和NUMA)的概念。

多核CPU

Registers	< 1ns
L1	约 1ns
L2	< 3ns
L3	约15ns
主存	约 80ns

为什么三层：工业测试的效果最好

缓存行大小：越大，局部性空间效率越大，读取越慢；越小，局部性空间效率越小，读取越快。64字节（intel）

Intel mesi 缓存一致性协议（又叫缓存锁）

其他 msi

一致性协议无法保证缓存一致性时：跨越多个缓存行、无法缓存的数据

使用总线锁的策略

实践的指导意义：

缓存行对齐：对于有些特别敏感的数字，会存在线程高竞争的访问，为了保证不发生伪共享，可以使用缓存行对齐的编程方式

JDK7中，很多采用long padding提高效率如disruptor

JDK8，加入了@Contended注解需要加上：JVM -XX:-RestrictContended 根据机器情况帮助填充

扩展概念：

1、合并写技术： Write Combining Buffer

一般是4个字节，由于ALU速度太快，所以在写入L1的同时，写入一个WC Buffer，满了之后，再直接更新到L2

2、UMA 和 NUMA 和 NUMA aware Non Uniform Memory Access

ZGC - NUMA aware：分配内存会优先分配该线程所在CPU的最近内存

参考：缓存一致性协议 https://www.cnblogs.com/z00377750/p/9180644.html

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

dunjian_cool

关注关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

深入理解存储器层次结构

极客重生

06-20

1303

概述对于一个简单的计算机系统模型，我们可以将存储器系统看做是一个线性的字节数组，而 CPU 能够在一个常数时间内访问每个存储器的位置。实际上，存储器系统（memory system）是一个具有不同容量、成本和访问时间的存储设备的层次结构。CPU 寄存器保存着最常用的数据。靠近 CPU 的小、快速的高速缓存存储器（cache memory）做为一部分存储在相对慢速的主存储器......

第2章 存储器层次结构设计

weixin_47955824的博客

06-07

1823

存储器层次结构的可能性追溯到20世纪40~50年代。虚拟存储器出现在20世纪60年代，缓存出现在70年代。导致存储器层次结构的设计发生重大变化的一个趋势是，DRAM密度的增长速度和访问时间的缩短速度都在持续变缓。DRAM中使用的槽形电容器设计限制了它的扩展能力。诸如堆叠存储器之类的封装技术很有可能成为提升带宽和缩短延迟的主要方式。闪存相对于DRAM的潜在优势也正是它的致命弱点：它必须采用相当慢的批擦除重写周期。相变材料相对闪存的几点优势：不再需要速度缓存的“擦除-写入”周期，寿命也要长的多。

参与评论您还未登录，请先登录后发表或查看评论

存储器层次结构

luoxn28的专栏

01-27

7394

存储器层次结构 好的程序代码不仅要有好的算法，对计算机硬件的充分利用也是很关键的一步。 存储器系统(memorysystem)是一个具有不同容量、成本和访问时间的存储设备的层次结构。CPU寄存器保存着最常用的数据。靠近CPU的小的、快速的高速缓存存储器 (cache memory)作为一部分存储在相对慢速的主存储器(mainmemory,简称主存)中的数据和指令

12.存储器层次结构1

08-03

在计算机系统中，存储器层次结构的设计对于系统的整体性能具有决定性影响。理解存储器的层次结构，不仅对计算机架构师来说至关重要，对于软件开发者而言，也是优化程序性能的关键。存储器层次结构是一种分层的存储...

CSAPP：第六章——存储器层次结构

yelvens的博客

03-28

2122

文章目录一、存储技术1.1 随机访问存储器1.1 随机访问存储器二、局部性三、存储器层次结构四、高速缓存存储器五、编写高速缓存有好的代码六、高速缓存对程序性能的影响如果数据在寄存器中，指令执行期间，访问需要0个始终周期；在高速缓存中，需要4～75个周期；在主存中，需要上百个周期；在磁盘中，大约要几千万个周期。一、存储技术 1.1 随机访问存储器 随机访问存储器（Random-Access Memory，RAM）分两类：静态（SRAM）和动态（DRAM）。都具有易失性，断电后数据丢失。 SRAM比DR

第五章 存储器层次结构.doc

07-06

第五章 存储器层次结构深入探讨了计算机系统中存储器设计的关键概念，旨在通过多层次的存储架构提高性能，平衡容量、速度与成本。存储器是计算机系统的心脏，其性能直接影响到整个系统的运行效率。首先，存储器的...

深入理解计算机系统：存储器层次结构

jinzhao1993的博客

12-06

7321

存储技术随机访问存储器（RAM）RAM分为两类：静态的和动态的。静态RAM（SRAM）比动态RAM（DRAM）更快，但也贵得多。一个系统的SRAM不会超过几兆字节，但是DRAM却有几百或几千兆字节。SRAMSRAM将每个位存储在一个双稳态的存储器单元里，每个单元是用一个六晶体管电路来实现的。这个电路有这样一个属性：它可以无限期地保持在两个不同的电压状态之一。其他任何状态都是不稳定的，电路会迅速转移到

【计算机组成原理】存储器的层次结构

最新发布

2401_83447580的博客

12-23

741

寄存器：位于CPU内部，访问速度最快，但容量最小。寄存器用于存储临时数据和寄存器之间的传递，是CPU进行数据处理时的重要存储单元。高速缓存（Cache）：位于CPU和主存之间，访问速度较快，容量较寄存器大但相对较小。Cache用于存储最近访问的数据和指令，以减少CPU对主存的访问次数，提高数据传输效率。主存储器（内存）：位于高速缓存和辅存之间，访问速度相对较慢，但容量较大。主存储器用于存储程序和数据，是计算机系统中最常用的存储设备。辅助存储器（外存）：位于计算机外部，访问速度最慢，但容量最大。

DJ4-1 存储器的层次结构

狂放不羁霸的博客

04-24

818

4.1.1 存储器的层次结构 1. 主存储器（内存，主存，可执行存储器） 2. 寄存器 3. 高速缓存 4. 磁盘缓存 存储器层次结构的特点 4.1.2 存储器管理的目的和功能 1. 主存储器的分配和管理 2. 提高主存储器的利用率 3. 扩充主存储器的容量 4. 存储空间的保护 4.1.3 存储分配的三种方式 1. 直接指定方式 2. 静态分配方式 3. 动态分配方式 4.1.4 基本概念 1. 逻辑地址（相对地址，虚地址） 2. 物理地址（绝对地址，实地址）

4.1 存储器的层次结构

tang7mj的博客

02-19

1130

计算机的存储系统被设计成多层结构，旨在解决速度、容量和成本之间的矛盾。从CPU寄存器到辅助存储（如硬盘和SSD），每一层存储器在速度、容量和成本上各有优缺点。层次越接近CPU，速度越快，容量越小，成本越高；反之，则速度越慢，容量越大，成本越低。主存储器和寄存器是计算机存储体系中不可或缺的两个环节，它们共同支撑着计算机的数据处理和程序运行。随着计算需求的不断增长，未来的发展无疑将进一步优化这两个存储层次的性能，以实现更高速度、更大容量和更低成本的数据存储和处理能力。

趣谈存储器层次

weixin_44413364的博客

04-23

152

主存用于保存进程运行时的程序和数据。处理机从主存取得指令和数据并将其存入相应的寄存器当中。寄存器寄存器具有与处理机相同的速度，故对寄存器的访问速度最快。完全能与CPU协同工作。用于存放处理机运行时的数据，以加速存储器的访问速度。高速缓存介于寄存器和存储器之间的存储器，主要用于备份内存中的常用数据，以加快访问内存的速度。访问速度高于内存的访问速度磁盘缓存用于暂时存放频繁使用的部...

深入理解计算机系统之六--存储器层次结构

天道酬勤

05-20

1324

一、小结 1、存储器系统是一个具有不同容量、成本和访问时间的存储设备的层次结构。CPU寄存器保存着最常用的数据。靠近CPU的小的、快速的高速缓存存储器作为一部分存储在相对慢速的主存储器中数据和指令的缓冲区域。主存缓存存储在容量较大的、慢速磁盘上的数据，而这些磁盘常常作为存储在通过网络连接的其他机器的磁盘或磁带上的数据的缓冲区域。 2、作为程序员需要理解存储器层次结构，因为它对应用程序的性能有着...

存储器层次结构·六

阅读修身

05-14

865

第6章 存储器层次结构 关键词：存储器层次结构，磁盘容量，时间和空间局部性，随机访问存储器，命中和不命中在我们对系统的研究种，我们依赖于一个简单的计算机系统模型，CPU执行指令，而存储器系统为CPU存放指令和数据。在我们简单的模型中，存储器是一个线性的字节数组，而CPU能够在一个常数时间内访问每个存储器位置。虽然迄今为止这都是一个有效的模型，但是它实际上没有反映现代系统实际工作的方式