硬件加速最主要的效果就体现在对循环体的并行化处理,在vivado HLS中对for循环添加Directive时如果位置没选好的话,
对性能的影响还是非常大的。以下试验针对在for循环两种不同位置添加pipeline然后C综合后的结果进行对比,对比发现第一
种方法比第二种快约2*10的三次方倍。第二种方法比不加pipeline快约2*10的三次方倍。
结论:有pipeline比没pipeline好,在整个循环体外加pipeline比在循环体内加效果更好
方法1.延时最小的添加方法

C综合结果显示:

方法2.延时稍大的

C综合结果显示:

方法3.不加pipeline

C综合结果显示:

本文通过实验对比了在Vivado HLS中对for循环添加Pipeline Directive的不同位置对性能的影响。发现将Pipeline添加在整个循环体外部比内部能带来更好的性能提升。
3819

被折叠的 条评论
为什么被折叠?



