volatile: 变量的理解

最新推荐文章于 2022-08-18 13:27:22 发布

xiaofei0859

最新推荐文章于 2022-08-18 13:27:22 发布

阅读量1.2k

点赞数

CC 4.0 BY-SA版权

文章标签：编译器 buffer 优化汇编 stream 多线程

本文链接：https://blog.youkuaiyun.com/xiaofei0859/article/details/5949123

本文深入解析了volatile变量在多线程环境中的作用及其如何防止编译器优化，通过实例展示了volatile关键字的应用场景与注意事项。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

volatile: 变量的理解

volatile 的一个很大的作用是防止编译器优化.

volatile应该解释为“直接存取原始内存地址”比较合适，“易变的”这种解释简直有点误导人；

“易变”是因为外在因素引起的，象多线程，中断等，并不是因为用volatile修饰了的变量就是“易变”了，假如没有外因，即使用volatile定义，它也不

会变化；

而用volatile定义之后，其实这个变量就不会因外因而变化了，可以放心使用了；大家看看前面那种解释（易变的）是不是在误导人

－－－－－－－－－－－－简明示例如下：－－－－－－－－－－－－－－－－－－
volatile关键字是一种类型修饰符，用它声明的类型变量表示可以被某些编译器未知的因素更改，比如：操作系统、硬件或者其它线程等。遇到这个关键字

声明的变量，编译器对访问该变量的代码就不再进行优化，从而可以提供对特殊地址的稳定访问。
使用该关键字的例子如下：
int volatile nVint;
>>>>当要求使用volatile 声明的变量的值的时候，系统总是重新从它所在的内存读取数据，即使它前面的指令刚刚从该处读取过数据。而且读取的数据立刻

被保存。
例如：
volatile int i=10;
int a = i;
...
//其他代码，并未明确告诉编译器，对i进行过操作
int b = i;
>>>>volatile 指出 i是随时可能发生变化的，每次使用它的时候必须从i的地址中读取，因而编译器生成的汇编代码会重新从i的地址读取数据放在b中。而

优化做法是，由于编译器发现两次从i读数据的代码之间的代码没有对i进行过操作，它会自动把上次读的数据放在b中。而不是重新从i里面读。这样以来，

如果i是一个寄存器变量或者表示一个端口数据就容易出错，所以说volatile可以保证对特殊地址的稳定访问。
>>>>注意，在vc6中，一般调试模式没有进行代码优化，所以这个关键字的作用看不出来。下面通过插入汇编代码，测试有无volatile关键字，对程序最终代

码的影响：
>>>>首先，用classwizard建一个win32 console工程，插入一个voltest.cpp文件，输入下面的代码：
>>
＃i nclude <stdio.h>
void main()
{
int i=10;
int a = i;
printf("i= %d",a);
//下面汇编语句的作用就是改变内存中i的值，但是又不让编译器知道
__asm {
mov dword ptr [ebp-4], 20h
}
int b = i;
printf("i= %d",b);
}
然后，在调试版本模式运行程序，输出结果如下：
i = 10
i = 32
然后，在release版本模式运行程序，输出结果如下：
i = 10
i = 10
输出的结果明显表明，release模式下，编译器对代码进行了优化，第二次没有输出正确的i值。下面，我们把 i的声明加上volatile关键字，看看有什么变

化：
＃i nclude <stdio.h>
void main()
{
volatile int i=10;
int a = i;
printf("i= %d",a);
__asm {
mov dword ptr [ebp-4], 20h
}
int b = i;
printf("i= %d",b);
}
分别在调试版本和release版本运行程序，输出都是：
i = 10
i = 32
这说明这个关键字发挥了它的作用！

需要注意的是，没有volatile也可能能正常运行，但是可能修改了编译器的优化级别之后就又不能正常运行了。因此经常会出现debug版本正常，但是

release版本却不能正常的问题。所以为了安全起见，只要是等待别的程序修改某个变量的话，就加上volatile关键字。
－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－
volatile对应的变量可能在你的程序本身不知道的情况下发生改变
比如多线程的程序，共同访问的内存当中，多个程序都可以操纵这个变量
你自己的程序，是无法判定合适这个变量会发生变化
还比如，他和一个外部设备的某个状态对应，当外部设备发生操作的时候，通过驱动程序和中断事件，系统改变了这个变量的数值，而你的程序并不知道。
对于volatile类型的变量，系统每次用到他的时候都是直接从对应的内存当中提取，而不会利用cache当中的原有数值，以适应它的未知何时会发生的变化，

系统对这种变量的处理不会做优化——显然也是因为它的数值随时都可能变化的情况。

------------------------------------------------------------------------

典型的例子
for ( int i=0; i<100000; i++);
这个语句用来测试空循环的速度的
但是编译器肯定要把它优化掉，根本就不执行
如果你写成
for ( volatile int i=0; i<100000; i++);
它就会执行了

volatile的本意是“易变的”
由于访问寄存器的速度要快过RAM，所以编译器一般都会作减少存取外部RAM的优化。比如：

static int i=0;

int main(void)
{
...
while (1)
{
if (i) dosomething();
}
}

/* Interrupt service routine. */
void ISR_2(void)
{
i=1;
}

程序的本意是希望ISR_2中断产生时，在main当中调用dosomething函数，但是，由于编译器判断在main函数里面没有修改过i，因此
可能只执行一次对从i到某寄存器的读操作，然后每次if判断都只使用这个寄存器里面的“i副本”，导致dosomething永远也不会被
调用。如果将将变量加上volatile修饰，则编译器保证对此变量的读写操作都不会被优化（肯定执行）。此例中i也应该如此说明。

一般说来，volatile用在如下的几个地方：

1、中断服务程序中修改的供其它程序检测的变量需要加volatile；

2、多任务环境下各任务间共享的标志应该加volatile；

3、存储器映射的硬件寄存器通常也要加volatile说明，因为每次对它的读写都可能由不同意义；

另外，以上这几种情况经常还要同时考虑数据的完整性（相互关联的几个标志读了一半被打断了重写），在1中可以通过关中断来实
现，2中可以禁止任务调度，3中则只能依靠硬件的良好设计了。

MSDN Library中写到:

volatile 关键字表示字段可能被多个并发执行线程修改。声明为 volatile 的字段不受编译器优化（假定由单个线程访问）的限制。这样可以确保该字段在

任何时间呈现的都是最新的值。[从这里可以看出,如果使用了该修饰符,则应该是每次都从内存中读取的,对吧!]

volatile 修饰符通常用于由多个线程访问而不使用 lock 语句（C# 参考）语句对访问进行序列化的字段。有关在多线程方案中使用 volatile 的示例，请

参见如何：创建和终止线程（C# 编程指南）。

volatile 关键字可应用于以下类型：

引用类型。

指针类型（在不安全的上下文中）。

整型，如 sbyte、byte、short、ushort、int、uint、char、float 和 bool。

具有整数基类型的枚举类型。

已知为引用类型的泛型类型参数。

IntPtr 和 UIntPtr。

所涉及的类型必须是类或结构的字段。不能将局部变量声明为 volatile。
__________________________________________________________________
volatile 的含义
volatile总是与优化有关，编译器有一种技术叫做数据流分析，分析程序中的变量在哪里赋值、在哪里使用、在哪里失效，分析结果可以用于常量合并，

常量传播等优化，进一步可以死代码消除。但有时这些优化不是程序所需要的，这时可以用volatile关键字禁止做这些优化，volatile的字面含义是易变的

，它有下面的作用：

1. 不会在两个操作之间把volatile变量缓存在寄存器中。在多任务、中断、甚至setjmp环境下，变量可能被其他的程序改变，编译器自己无法知道，

volatile就是告诉编译器这种情况。
2. 不做常量合并、常量传播等优化，所以像下面的代码：
volatile int i = 1;
if (i > 0) ...
if的条件不会当作无条件真.
3. 对volatile变量的读写不会被优化掉。如果你对一个变量赋值但后面没用到，编译器常常可以省略那个赋值操作，然而对Memory Mapped IO的处理是不

能这样优化的。
前面有人说volatile可以保证对内存操作的原子性，这种说法不大准确，其一，x86需要LOCK前缀才能在SMP下保证原子性，其二，RISC根本不能对内存直

接运算，要保证原子性得用别的方法，如atomic_inc。
对于jiffies，它已经声明为volatile变量，我认为直接用jiffies++就可以了，没必要用那种复杂的形式，因为那样也不能保证原子性。
你可能不知道在Pentium及后续CPU中，下面两组指令
inc jiffies
;;
mov jiffies, %eax
inc %eax
mov %eax, jiffies
作用相同，但一条指令反而不如三条指令快。

****************************************************

volatile 防止优化

有时在编译代码如果选用了优化级别 -O2 和 -O3 ，会产生某些问题。例如，可能在争夺硬件资源而陷入死循环，或者多个进程有些预想不到的行为。当遇到这些情况，你可能需要把有些变量定义为 volatile。

如果将一个变量定义为 volatile 则相当于告诉编译器该变量可能随时被改变，例如被操作系统或硬件所改变。因为带有限定符 volatile 的变量可以在任何时刻改变，该变量的物理地址可能被频繁地访问。这就意味着编译器不能对这些变量实现优化，例如，将变量缓存到寄存器避免访问内存。

相反，如果一个变量未被定义成 volatile，则编译器认为该变量不能在应用程序之外改变。因此编译器可对这种变量实行优化。

关键字 volatile 的用法可通过表 4.5 中的两个例子演示。两个例子均是循环读取一个缓冲的值直到状态标志 buffer_full 变为真。两个程序均假设状态标志 buffer_full 是可变的。

第一个例子是一个无知的循环。注意到变量 buffer_full 没有定义成 volatile 类型。相反，第二个程序是同样的循环，但 buffer_full 定义为 volatile 类型。

Table 4.5. volatile 和非 volatile类型的缓冲循环C代码

非 Volatile 类型的缓冲循环	Volatile 类型的缓冲循环
int buffer_full; int read_stream(void) { int count = 0; while (!buffer_full) { count++; } return count; }	volatile int buffer_full; int read_stream(void) { int count = 0; while (!buffer_full) { count++; } return count; }

非 Volatile 类型的缓冲循环

Volatile 类型的缓冲循环

int buffer_full;

int read_stream(void)
{
    int count = 0;

    while (!buffer_full)
    {
        count++;
    }

    return count;
}

volatile int buffer_full;

int read_stream(void)
{
    int count = 0;

    while (!buffer_full)
    {
        count++;
    }

    return count;
}

表 4.6 显示了表 4.1 通过编译之后相应的汇编程序。这些C代码在编译时，编译器采用优化选项 -O2。

Table 4.6. 和非 volatile类型的缓冲循环汇编程序

非 Volatile 类型的缓冲循环	Volatile 类型的缓冲循环
read_stream PROC LDR r1, \|L1.28\| MOV r0, #0 LDR r1, [r1, #0] \|L1.12\| CMP r1, #0 ADDEQ r0, r0, #1 BEQ \|L1.12\| ; infinite loop BX lr ENDP \|L1.28\| DCD \|\|.data\|\| AREA \|\|.data\|\|, DATA, ALIGN=2 buffer_full DCD 0x00000000	read_stream PROC LDR r1, \|L1.28\| MOV r0, #0 \|L1.8\| LDR r2, [r1, #0]; ; buffer_full CMP r2, #0 ADDEQ r0, r0, #1 BEQ \|L1.8\| BX lr ENDP \|L1.28\| DCD \|\|.data\|\| AREA \|\|.data\|\|, DATA, ALIGN=2 buffer_full DCD 0x00000000

非 Volatile 类型的缓冲循环

Volatile 类型的缓冲循环

read_stream PROC
    LDR      r1, |L1.28|
    MOV      r0, #0
    LDR      r1, [r1, #0]
|L1.12|
    CMP      r1, #0
    ADDEQ    r0, r0, #1
    BEQ      |L1.12|      ; infinite loop
    BX       lr
    ENDP

|L1.28|
    DCD      ||.data||

    AREA ||.data||, DATA, ALIGN=2

buffer_full
    DCD      0x00000000

read_stream PROC

    LDR      r1, |L1.28|
    MOV      r0, #0
|L1.8|
    LDR      r2, [r1, #0];  ; buffer_full
    CMP      r2, #0
    ADDEQ    r0, r0, #1
    BEQ      |L1.8|
    BX       lr
    ENDP

|L1.28|
    DCD      ||.data||

    AREA ||.data||, DATA, ALIGN=2

    buffer_full
        DCD      0x00000000

在非 volatile 类型的缓冲循环表 4.6 中, 语句 LDR r0, [r0, #0] 在循环标号 |L1.8| 之外将 buffer_full 的值装载到寄存器 r0 。因为 buffer_full 没有定义成 volatile，编译器认为该值不能在程序之外被修改。当已经把 buffer_full 的值读入到寄存器 r0 后，如果使能优化编译器将不再从内存里重新装载该值，因为它的值不能在程序之外改变。结果是造成无限循环。

相反，在 volatile 类型的缓冲循环汇编代码中编译器认为 buffer_full 可能随时改变，因此对它不作优化操作。相应地，在循环标号|L1.4| 之内将变量 buffer_full 装载到寄存器 r0 。因而这是一个正确的汇编代码。

当一个变量的值可能在应用程序不知道的情况下可能改变其值，为了避免优化带来的问题，需要将其定义为 volatile 类型。当有以下情况时需要定义为 volatile 类型的变量：