http://www.flipcode.com/archives/Vector_Matrix_Quaternion_Math_Library.shtml
以前还真没注意,原来有个指令是可以快速求出sincos的值:sweet
ForceInline Float __fastcall SinCos(Float x, PFloat cosval) { x; cosval; // Just for this shit "unreferenced formal parameter" warning __asm { fld dword ptr [x] fsincos fstp dword ptr [cosval] } }
把程序里的用angle生成复数的代码换成sincos这个,fft的计算部分(简单实现的一个cooley fft)从0.85ms降到0.55ms,提升了%35。
日啊,哥激动了,没法淡定了啊。
通过使用Intel CPU的FSINCOS指令替代传统sin和cos函数计算, 实现了复数生成过程的显著加速。在简单的Cooley-Tukey FFT实现中, 该方法将计算时间从0.85毫秒降低到了0.55毫秒, 性能提升约35%。
2193

被折叠的 条评论
为什么被折叠?



