测试代码如下:
#include <stdio.h>
#include <pthread.h>
#define TIMES 999999U
#define THR_MAX 6
unsigned int counts = 0;
void *thrdFunc(void*)
...{
for ( int i=0;i < TIMES; ++i )
...{
++counts;
}
return NULL;
}
int main()
...{
pthread_t pid[THR_MAX];
for ( int i = 0; i < THR_MAX; ++i )
...{
pthread_create( &pid[i], NULL, thrdFunc, NULL );
}
for ( int i = 0; i < THR_MAX; ++i )
...{
pthread_join( pid[i], NULL );
}
if ( counts != TIMES*THR_MAX )
...{
printf( "FAIL:%d ", counts );
}
else
...{
printf( "OK:%d ", counts );
}
return 0;
}
以上代码分别 在X86(GCC编译器)和XScale处理器上测试,多次测试的结果是:
X86上输出OK,而XScale输出FAIL。
分析如下:X86是CISC(复杂指令集)处理器,有直接操作内存的指令,示例中++counts;被编译成incl counts。XScale是RISC(精简指令集)处理器,RISC是基于Load/Store的指令集,没有直接操作内存的指令,示例中++counts;被编译为,
ldr r2, .L5
ldr r3, .L5
ldr r3, [r3, #0]
add r3, r3, #1
str r3, [r2, #0]
因此++int在像X86这样的CISC处理器中可以是原子操作,而在RISC处理器中不可能是原子操作。
同时,也和编译器有关,以上结果是在未优化的情况下。
一般来说,++int操作不可看作为原子操作。
本文通过一个简单的C语言示例,对比了X86和XScale处理器上++int操作的不同行为,揭示了CISC与RISC处理器架构下原子操作的实现差异,并讨论了编译器优化的影响。
4544

被折叠的 条评论
为什么被折叠?



