线程局部存储(TLS, thread local storage)是一个已有的概念。简单地说,所谓线程局部存储变量,就是拥有线程生命期及线程可见性的变量。
C++11对TLS标准做出了一些统一的规定。与__thread修饰符类似,声明一个TLS变量的语法很简单,即通过thread_local修饰符声明变量即可。
虽然TLS变量的声明很简单,使用也很直观,不过实际上TLS的实现需要涉及编译器、链接器、加载器甚至是操作系统的相互配合。在TLS中一个常被讨论的问题就是TLS变量的静态/动态分配的问题,即TLS变量的内存究竟是在程序一开始就被分配还是在线程开始运行时被分配。通常情况下,前者比后者更易于实现。C++11标准允许平台/编译器自行选择采用静态分配或动态分配,或者两者都支持。还有一点值得注意的是,C++11对TLS只是做了语法上的统一,而对其实现并没有做任何性能上的规定。这可能导致thread_local声明的变量在不同平台或者不同的TLS实现上出现不同的性能(通常TLS变量的读写性能不会高于普通的全局/静态变量)。如果读者想得到最佳的平台上的TLS变量的运行性能的话,最好还是阅读代码运行平台的相关文档。
linux反汇编分析thread_local实现
FS寄存器指向当前活动线程的TEB结构(线程结构),所以初步确认thread_local是直接放入线程本地数据中。
void func1() {
400b87: 55 push %rbp
400b88: 48 89 e5 mov %rsp,%rbp
thread_local int test1 = 1;
test1++;
400b8b: 64 8b 04 25 f8 ff ff mov %fs:0xfffffffffffffff8,%eax
400b92: ff
400b93: 83 c0 01 add $0x1,%eax
400b96: 64 89 04 25 f8 ff ff mov %eax,%fs:0xfffffffffffffff8
摘自:《深入理解C++11:C++11新特性解析与应用》