Hybrid TLB Coalescing：Improving TLB Translation Coverage under Diverse Fragmented Memory Allocations

最新推荐文章于 2022-12-18 21:40:36 发布

原创

最新推荐文章于 2022-12-18 21:40:36 发布 · 468 阅读

·

2

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#TLB #translation coverage

论文提出了混合TLB合并技术，以解决在碎片化和多样化存储分配中TLB缺失的问题。通过操作系统设置的锚表项，该技术能动态适应内存分配的连续性，提高TLB翻译覆盖范围，同时保持内存分配的灵活性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Hybrid TLB Coalescing: Improving TLB Translation Coverage under Diverse Fragmented Memory Allocations

摘要：
- 背景：
  - 在大的存储类应用程序中，会出现很多TLB缺失，因此出现了一些技术（大页，变长段variable length segments，硬件合并TLB表项）用来增加有限硬件资源的TLB的覆盖范围，这些技术主要依赖于连续的内存分配策略
  - 问题：在异构存储系统中，使用大页经常导致性能下降或者是更加难以分配大页，并且之前的技术都需要最优的块大小，而现实中，内存的分配并不能够提供这种完美的块大小
- 论文工作：为缓解碎片化和多样化存储分配情况下的TLB缺失，提出了软硬件混合的地址翻译结构，能够高效的适应不同的存储映射
  - 论文提出的混合合并策略中，OS在分配连续存储的信息存放在页表项的子集中，这些页表项称为锚表项（anchor entry）
  - 在地址翻译的过程中，锚项可以提供在其之后的连续的页的地址翻译。因此少量的锚项可以覆盖很大的虚拟地址空间的翻译，从而改进TLB的覆盖范围
  - 混合合并策略最重要的优点在于能够动态的改变锚项的覆盖范围，从而反映出当前分配连续性的状态
  - 优点：通过OS直接设置的内存分配的连续性信息，论文在很小的硬件改动下，可以提供可伸缩的TLB地址翻译覆盖范围的改进，同时允许灵活的内存分配
介绍：
- 改进TLB地址翻译效率的两类方法：
  - 改进覆盖范围，在给定面积和功耗预算的情况下，提升TLB翻译的覆盖范围
  - 减少TLB缺失的代价
- 改进TLB覆盖范围的技术
  - 增加页的大小（最为常见）。在商业x86处理器中，同时支持4KB，2MB和1GB的页大小
  - 变长的HW段翻译替代基于页的地址翻译，依赖于OS能否为每一个段分配连续的大存储区域
  - 基于硬件的合并技术（CoLT和cluster TLB），将多个页面的地址翻译合并到一个TLB表项中，只要页面的物理地址在一个连续的区域中，OS不需要保证一定要分配固定大小的页面
- 内存分配的灵活性（allocation flexibility）和地址翻译覆盖范围的伸缩性（scalability of translation coverage）
  - 增加页大小：限制了覆盖范围的伸缩性
  - 可变硬件段：覆盖范围的伸缩性最好，但是分配策略需要更加的严格，才能够得到好处
  - 硬件合并：允许灵活的分配，但是覆盖范围被限定在4或8页面（由于是硬件实现）
- NUMA存储系统中的新问题:
  - 在NUMA中连续的内存分配并不总是可能，并且可能会降低性能
  - 存储的异构型要求细粒度的存储映射，以保证将频繁使用的页面放在更快更近的地方，因此很难分配大的连续内存块
- 为了适应多样的内存分配场景，论文提出了混合的地址翻译技术（hybrid coalescing），以改进地址翻译的覆盖范围
  - 锚项是每N个页表项上指定的一个表项，包含着内存连续分配的信息，即能够指示该

最低0.47元/天解锁文章

200万优质内容无限畅学

博客等级

码龄11年

89
原创

56
点赞

260
收藏

114
粉丝

关注

私信

热门文章

分类专栏

上一篇：: Freeway：Maximizing MLP for Slice-Out-of-Order Execution

下一篇：: Cost-Effective Speculative Scheduling in High Performance Processors

最新评论

实验纪录——GEM5+McPAT
YELLOW FLASH: 我报错了Traceback (most recent call last): File "GEM5ToMcPAT.py", line 163, in <module> main() File "GEM5ToMcPAT.py", line 56, in main dumpMcpatOut(opts.out) File "GEM5ToMcPAT.py", line 77, in dumpMcpatOut param.attrib['value'] = str(eval(str(value))) File "<string>", line 1, in <module> TypeError: unsupported operand type(s) for /: 'float' and 'list'，请问应该怎么解决呀？
Processor Microarchitecture
滴滴星星 123: aligner（定位器）具体是指什么
I-SPY Context-Driven Conditional Instruction Prefetching with Coalescing
不正经的kimol君: 大佬的文章让我受益匪浅，如痴如醉，以后的日子还希望能够得到大佬的谆谆指点！
Meltdown Reading Kernel Memory from User Space
DEEPBLUEEEEE: 您好，请问rdtscp.h是什么内容呢
Sniper中cache实现
yi_1973: 您好，想请教一下sniper可以输出LL3 miss的访存序列么？我看到有文章说是用sniper输出了访问trace，但是看了下sniper的配置好像并没有实现这项功能，是不是需要自己修改代码来输出呢，谢谢！

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。