Rethinking SIMD Vectorization for In-Memory Databases 论文阅读笔记

最新推荐文章于 2025-06-14 00:15:00 发布

原创最新推荐文章于 2025-06-14 00:15:00 发布 · 2.9k 阅读

·

1

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

工程同时被 2 个专栏收录

37 篇文章

订阅专栏

计算机理论

12 篇文章

订阅专栏

探讨了SIMD技术在内存数据库中的优化策略，包括选择性存储、加载、聚集和分散操作，以及线性探测哈希表的构建和探查算法。通过改进的流程，如RankandPermute和优化的哈希表操作，显著提升了数据库查询效率。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Rethinking SIMD Vectorization for In-Memory Databases 论文阅读笔记

基本操作

selective store

将 vector lane 的一部分（根据 mask）写入连续内存

在这里插入图片描述

selective load

从连续内存读入到 vector lane 的一部分（根据 mask）

在这里插入图片描述

selective gather

从非连续内存（根据 index vector）读入到 vector lane

在这里插入图片描述

selective scatter

将 vector lane 写入到非连续内存（根据 index vector）

在这里插入图片描述

注意 gather 和 scatter 并不能1个时钟周期内完成

Selection Scan

在这里插入图片描述

W：SIMD vector 长度
j：输出数量
l：buffer B[] 的最后一个元素的后继位置
B[]：buffer，缓存被 selected 行的标号（没有明说，不过我认为 |B| 是 W 的整数倍）
r[]：序号的 vector，长度为 W，用于 selective store，mask m
m：predicate 结果，是一个 mask vector

在这里插入图片描述

意思就是每次处理一批，然后差不多满了就 output。

Hash Table

Linear Probing

Probe

在这里插入图片描述

参考 Vectorization vs. Compilation in Query Execution 论文阅读笔记

和上一篇笔记中的算法有一些区别，没有 match[]，而是每轮循环有被排除掉的就去拿新的 input。Algorithm5 最后一行的 m 表示排除掉的（包括 已经匹配成功的 和 匹配完所有都失败的）就拿新的 input；还在匹配的就 offset+1，继续尝试在 bucket 中匹配。（所以 output 顺序和 probe input 顺序可能不一致。上一篇笔记里的算法是把每轮 input check 完才继续下一轮）

Build

在这里插入图片描述

居然没有做 Rank and Permute 来 group by key？？？参考 A Vectorized Hash-Join 论文阅读笔记
可以使用 Rank and Permute，然后查询 next[] 来加速 probe！！！

我改进的 probe 流程，针对 build 时使用 rank and permute 来 group by keys

在这里插入图片描述

Reference

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。