GPU 在数据库系统中的应用与时间序列数据库动态压缩策略
1. GPU 感知数据库架构概述
GPU 感知(协处理器加速)数据库架构是内存数据库系统进一步减少因处理设备间并行化导致的“内存墙”问题的自然发展方向。一个理想的 GPU 感知数据库架构应具备以下特点:
- 内存内、面向列的 DBMS :采用按列存储数据的方式,有助于提高查询效率。
- 一次处理一个操作符的批量处理模型 :能够高效地处理大量数据。
- 协处理器和数据局部性感知的查询优化器 :可将工作负载分配到所有可用的(协)处理器上。
- 乐观事务协议 :例如时间戳协议,确保事务的一致性。
2. GPU 加速数据管理面临的挑战
目前,GPU 加速数据管理仍存在一些尚未解决的挑战:
|挑战|描述|
| ---- | ---- |
|数据放置策略|GPU 加速数据库试图将关系数据缓存在设备上以避免数据传输,但设备内存有限,确定将哪部分数据卸载到 GPU 是一个难题。|
|操作符适用性预测|由于结果传输成本,生成大量结果集的操作符通常不适合 GPU 卸载。而且在执行前通常无法知道操作的结果大小,因此预测给定操作符是否能从 GPU 中受益是一个难题。|
|磁盘数据库适用性|GPU 加速操作符对基于磁盘的数据库系统作用不大,因为大部分时间都花在磁盘 I/O 上。GPU 只有在数据进入主内存后才能提高性能,与总查询运行时间相比,节省的时间较少。此外,磁盘驻留数据库通常非常大,更难找到最佳的数据放置策略。|
超级会员免费看
订阅专栏 解锁全文

61

被折叠的 条评论
为什么被折叠?



