pthread_spinlock_t的特点是高效。但是如果一个线程在获得spinlock的时候陷入操作系统内核(比如时间片超时、缺页异常)会怎么样呢?另外一个线程在获取spinlock的时候会一直占用cpu。会有一个瞬间的cpu占用率高峰?这个高峰的持续时间取决于另外一个线程何时从内核返回。当然,如果临界区很小的话,这个冲突的几率也是很小的。但是使用pthread_mutex_t就不会有这个问题,代价是线程上下文切换的开销。
以下代码使用usleep(0)来模拟时间片超时的情况,证实了这个猜想是符合实际的。
另外,spinlock的还有一个实现上的特点是会锁总线,降低系统吞吐量。对于内核来说,线程数就是核心/cpu数量,所以影响不大?但是对于应用程序来说,如果线程很多(>>cpu数量)而且冲突严重,会非常影响性能?
#include <pthread.h>
#include <unistd.h>
pthread_spinlock_t lock = 0;
int count = 0;
void* work(void* param)
{
for (int i = 0; i < 10000000; i++)
{
pthread_spin_lock(&lock);
++count;
usleep(0);
pthread_spin_unlock(&lock);
}
return NULL;
}
int main()
{
pthread_t pt = 0;
pthread_spin_init(&lock, PTHREAD_PROCESS_PRIVATE);
pthread_create(&pt, NULL, work, NULL);
for (int i = 0; i < 10000000; i++)
{
pthread_spin_lock(&lock);
++count;
pthread_spin_unlock(&lock);
}
pthread_join(pt, NULL);
pthread_spin_destroy(&lock);
return 0;
}
以下代码使用usleep(0)来模拟时间片超时的情况,证实了这个猜想是符合实际的。
另外,spinlock的还有一个实现上的特点是会锁总线,降低系统吞吐量。对于内核来说,线程数就是核心/cpu数量,所以影响不大?但是对于应用程序来说,如果线程很多(>>cpu数量)而且冲突严重,会非常影响性能?
#include <pthread.h>
#include <unistd.h>
pthread_spinlock_t lock = 0;
int count = 0;
void* work(void* param)
{
for (int i = 0; i < 10000000; i++)
{
pthread_spin_lock(&lock);
++count;
usleep(0);
pthread_spin_unlock(&lock);
}
return NULL;
}
int main()
{
pthread_t pt = 0;
pthread_spin_init(&lock, PTHREAD_PROCESS_PRIVATE);
pthread_create(&pt, NULL, work, NULL);
for (int i = 0; i < 10000000; i++)
{
pthread_spin_lock(&lock);
++count;
pthread_spin_unlock(&lock);
}
pthread_join(pt, NULL);
pthread_spin_destroy(&lock);
return 0;
}