我想使用bts和bt x86汇编指令来加速Mac上C代码中的位操作.在
Windows上,_bittestandset和_bittest内在函数运行良好,并提供显着的性能提升.在Mac上,gcc编译器似乎不支持这些,所以我试图直接在汇编程序中执行它.
这是我的C代码(注意’bit’可以是> = 32):
typedef unsigned long LongWord;
#define DivLongWord(w) ((unsigned)w >> 5)
#define ModLongWord(w) ((unsigned)w & (32-1))
inline void SetBit(LongWord array[], const int bit)
{
array[DivLongWord(bit)] |= 1 << ModLongWord(bit);
}
inline bool TestBit(const LongWord array[], const int bit)
{
return (array[DivLongWord(bit)] & (1 << ModLongWord(bit))) != 0;
}
以下汇编程序代码可以工作,但不是最优的,因为编译器无法优化寄存器分配:
inline void SetBit(LongWord* array, const int bit)
{
__asm {
mov eax, bit
mov ecx, array
bts [ecx], eax
}
}
问题:如何使编译器完全优化bts指令?如何用bt指令替换TestBit?
作者探讨了如何在Mac上的C代码中使用bts和bt汇编指令进行位操作,并分享了在gcc编译器下遇到的问题。通过实例展示了如何改进SetBit和TestBit函数的汇编代码,以期望得到更好的性能。寻求优化寄存器分配和bt指令应用的解决方案。
1013

被折叠的 条评论
为什么被折叠?



