图形硬件上的正则表达式匹配与多字节推测匹配技术
图形硬件正则表达式匹配实验
在正则表达式匹配的原始吞吐量实验中,我们评估了在GPU上实现的正则表达式匹配的原始处理吞吐量,此过程不包含将数据包传输到GPU内存空间的成本。
实验通过图8展示了CPU和GPU实现的原始计算吞吐量,以每秒处理的数据平均大小来衡量。同时,我们还探索了不同类型内存(全局设备内存和纹理内存)存储状态机表时的性能。水平轴表示GPU一次处理的数据包数量。
| 内存类型 | 与CPU实现对比 | 具体表现 |
|---|---|---|
| 全局设备内存 | 对于大缓冲区大小,GPU实现比CPU实现快约18倍 | - |
| 纹理内存 | 使用4096字节数据包缓冲区时,GeForce 9800比CPU实现提高了48.2倍 | 达到16 Gbit/s的原始处理吞吐量,增加数据包缓冲区大小从4096到32768数据包仅有轻微改善 |
使用较旧的GeForce 8600GT卡(仅含32个运行在1.2GHz的流处理器)重复实验,发现从旧型号到新型号性能翻倍,这表明我们的实现能适应新型显卡。
graph LR
A[实验开始] --> B[选择内存类型]
超级会员免费看
订阅专栏 解锁全文
16

被折叠的 条评论
为什么被折叠?



