摘要:
monetdb对于经典的火山模型中的性能瓶颈点做分析后认为, 基于迭代器元组解释执行将造成cpu执行效率的降低, 从而导致火山模型这个执行架构是一个低效的架构。
针对cpu硬件的特点, monetdb设计了X100引擎, 本文分析做出如此设计的硬件基础。
cpu管线:
参考:
https://www.cidrdb.org/cidr2005/papers/P19.pdf
浅谈CPU的执行效率与内部的执行管道流水线_光宇广贞的博客-优快云博客
分析:
- 一条汇编指令在cpu中的执行, 分成多个阶段, 整体上被称为管道或者管线
- 管线划分的阶段越多, 越有利于提升cpu的主频
- 管线阶段越多, 分支预测失败后, 就需要重置管线的操作越多
- cpu主频提升后, 处理性能存在降低的情况, 原因在乎分支预测失败造成的管线重置
- 如果一条指令必须要拿到前一条指令的结果才能执行, 那么该指令就必须等待前一条指令执行完毕, 两条指令无法并行
火山模型造成的cpu执行效率的低效:
- 迭代器模式造成处理下一个元组需要等待上一个元组执行完毕, 从而造成cpu指令只能串行执行
- 元组的解释执行, 造成cpu的分支预测失效, if造成的分支预测降低
向量化SIMD/AVX:
https://github.com/adofsauron/vector-simd-avx-dev