volatile: 变量的理解
volatile 的一个很大的作用是防止编译器优化.
volatile应该解释为“直接存取原始内存地址”比较合适,“易变的”这种解释简直有点误导人;
“易变”是因为外在因素引起的,象多线程,中断等,并不是因为用volatile修饰了的变量就是“易变”了,假如没有外因,即使用volatile定义,它也不
会变化;
而用volatile定义之后,其实这个变量就不会因外因而变化了,可以放心使用了; 大家看看前面那种解释(易变的)是不是在误导人
------------简明示例如下:------------------
volatile关键字是一种类型修饰符,用它声明的类型变量表示可以被某些编译器未知的因素更改,比如:操作系统、硬件或者其它线程等。遇到这个关键字
声明的变量,编译器对访问该变量的代码就不再进行优化,从而可以提供对特殊地址的稳定访问。
使用该关键字的例子如下:
int volatile nVint;
>>>>当要求使用volatile 声明的变量的值的时候,系统总是重新从它所在的内存读取数据,即使它前面的指令刚刚从该处读取过数据。而且读取的数据立刻
被保存。
例如:
volatile int i=10;
int a = i;
...
//其他代码,并未明确告诉编译器,对i进行过操作
int b = i;
>>>>volatile 指出 i是随时可能发生变化的,每次使用它的时候必须从i的地址中读取,因而编译器生成的汇编代码会重新从i的地址读取数据放在b中。而
优化做法是,由于编译器发现两次从i读数据的代码之间的代码没有对i进行过操作,它会自动把上次读的数据放在b中。而不是重新从i里面读。这样以来,
如果i是一个寄存器变量或者表示一个端口数据就容易出错,所以说volatile可以保证对特殊地址的稳定访问。
>>>>注意,在vc6中,一般调试模式没有进行代码优化,所以这个关键字的作用看不出来。下面通过插入汇编代码,测试有无volatile关键字,对程序最终代
码的影响:
>>>>首先,用classwizard建一个win32 console工程,插入一个voltest.cpp文件,输入下面的代码:
>>
#i nclude <stdio.h>
void main()
{
int i=10;
int a = i;
printf("i= %d",a);
//下面汇编语句的作用就是改变内存中i的值,但是又不让编译器知道
__asm {
mov dword ptr [ebp-4], 20h
}
int b = i;
printf("i= %d",b);
}
然后,在调试版本模式运行程序,输出结果如下:
i = 10
i = 32
然后,在release版本模式运行程序,输出结果如下:
i = 10
i = 10
输出的结果明显表明,release模式下,编译器对代码进行了优化,第二次没有输出正确的i值。下面,我们把 i的声明加上volatile关键字,看看有什么变
化:
#i nclude <stdio.h>
void main()
{
volatile int i=10;
int a = i;
printf("i= %d",a);
__asm {
mov dword ptr [ebp-4], 20h
}
int b = i;
printf("i= %d",b);
}
分别在调试版本和release版本运行程序,输出都是:
i = 10
i = 32
这说明这个关键字发挥了它的作用!
需要注意的是,没有volatile也可能能正常运行,但是可能修改了编译器的优化级别之后就又不能正常运行了。因此经常会出现debug版本正常,但是
release版本却不能正常的问题。所以为了安全起见,只要是等待别的程序修改某个变量的话,就加上volatile关键字。
------------------------------------
volatile对应的变量可能在你的程序本身不知道的情况下发生改变
比如多线程的程序,共同访问的内存当中,多个程序都可以操纵这个变量
你自己的程序,是无法判定合适这个变量会发生变化
还比如,他和一个外部设备的某个状态对应,当外部设备发生操作的时候,通过驱动程序和中断事件,系统改变了这个变量的数值,而你的程序并不知道。
对于volatile类型的变量,系统每次用到他的时候都是直接从对应的内存当中提取,而不会利用cache当中的原有数值,以适应它的未知何时会发生的变化,
系统对这种变量的处理不会做优化——显然也是因为它的数值随时都可能变化的情况。
------------------------------------------------------------------------
典型的例子
for ( int i=0; i<100000; i++);
这个语句用来测试空循环的速度的
但是编译器肯定要把它优化掉,根本就不执行
如果你写成
for ( volatile int i=0; i<100000; i++);
它就会执行了
volatile的本意是“易变的”
由于访问寄存器的速度要快过RAM,所以编译器一般都会作减少存取外部RAM的优化。比如:
static int i=0;
int main(void)
{
...
while (1)
{
if (i) dosomething();
}
}
/* Interrupt service routine. */
void ISR_2(void)
{
i=1;
}
程序的本意是希望ISR_2中断产生时,在main当中调用dosomething函数,但是,由于编译器判断在main函数里面没有修改过i,因此
可能只执行一次对从i到某寄存器的读操作,然后每次if判断都只使用这个寄存器里面的“i副本”,导致dosomething永远也不会被
调用。如果将将变量加上volatile修饰,则编译器保证对此变量的读写操作都不会被优化(肯定执行)。此例中i也应该如此说明。
一般说来,volatile用在如下的几个地方:
1、中断服务程序中修改的供其它程序检测的变量需要加volatile;
2、多任务环境下各任务间共享的标志应该加volatile;
3、存储器映射的硬件寄存器通常也要加volatile说明,因为每次对它的读写都可能由不同意义;
另外,以上这几种情况经常还要同时考虑数据的完整性(相互关联的几个标志读了一半被打断了重写),在1中可以通过关中断来实
现,2中可以禁止任务调度,3中则只能依靠硬件的良好设计了。
MSDN Library中写到:
volatile 关键字表示字段可能被多个并发执行线程修改。声明为 volatile 的字段不受编译器优化(假定由单个线程访问)的限制。这样可以确保该字段在
任何时间呈现的都是最新的值。[从这里可以看出,如果使用了该修饰符,则应该是每次都从内存中读取的,对吧!]
volatile 修饰符通常用于由多个线程访问而不使用 lock 语句(C# 参考)语句对访问进行序列化的字段。有关在多线程方案中使用 volatile 的示例,请
参见如何:创建和终止线程(C# 编程指南)。
volatile 关键字可应用于以下类型:
引用类型。
指针类型(在不安全的上下文中)。
整型,如 sbyte、byte、short、ushort、int、uint、char、float 和 bool。
具有整数基类型的枚举类型。
已知为引用类型的泛型类型参数。
IntPtr 和 UIntPtr。
所涉及的类型必须是类或结构的字段。不能将局部变量声明为 volatile。
__________________________________________________________________
volatile 的含义
volatile总是与优化有关,编译器有一种技术叫做数据流分析,分析程序中的变量在哪里赋值、在哪里使用、在哪里失效,分析结果可以用于常量合并,
常量传播等优化,进一步可以死代码消除。但有时这些优化不是程序所需要的,这时可以用volatile关键字禁止做这些优化,volatile的字面含义是易变的
,它有下面的作用:
1. 不会在两个操作之间把volatile变量缓存在寄存器中。在多任务、中断、甚至setjmp环境下,变量可能被其他的程序改变,编译器自己无法知道,
volatile就是告诉编译器这种情况。
2. 不做常量合并、常量传播等优化,所以像下面的代码:
volatile int i = 1;
if (i > 0) ...
if的条件不会当作无条件真.
3. 对volatile变量的读写不会被优化掉。如果你对一个变量赋值但后面没用到,编译器常常可以省略那个赋值操作,然而对Memory Mapped IO的处理是不
能这样优化的。
前面有人说volatile可以保证对内存操作的原子性,这种说法不大准确,其一,x86需要LOCK前缀才能在SMP下保证原子性,其二,RISC根本不能对内存直
接运算,要保证原子性得用别的方法,如atomic_inc。
对于jiffies,它已经声明为volatile变量,我认为直接用jiffies++就可以了,没必要用那种复杂的形式,因为那样也不能保证原子性。
你可能不知道在Pentium及后续CPU中,下面两组指令
inc jiffies
;;
mov jiffies, %eax
inc %eax
mov %eax, jiffies
作用相同,但一条指令反而不如三条指令快。
****************************************************
volatile 防止优化
有时在编译代码如果选用了优化级别 -O2
和 -O3
,会产生某些问题。例如,可能在争夺硬件资源而陷入死循环,或者多个进程有些预想不到的行为。当遇到这些情况,你可能需要把有些变量定义为 volatile。
如果将一个变量定义为 volatile 则相当于告诉编译器该变量可能随时被改变,例如被操作系统或硬件所改变。因为带有限定符 volatile 的变量可以在任何时刻改变,该变量的物理地址可能被频繁地访问。这就意味着编译器不能对这些变量实现优化,例如,将变量缓存到寄存器避免访问内存。
相反,如果一个变量未被定义成 volatile,则编译器认为该变量不能在应用程序之外改变。因此编译器可对这种变量实行优化。
关键字 volatile 的用法可通过 表 4.5 中的两个例子演示。两个例子均是循环读取一个缓冲的值直到状态标志 buffer_full
变为真。两个程序均假设状态标志 buffer_full
是可变的。
第一个例子是一个无知的循环。注意到变量 buffer_full
没有定义成 volatile 类型。相反,第二个程序是同样的循环,但 buffer_full
定义为 volatile 类型。
Table 4.5. volatile 和非 volatile类型的缓冲循环C代码
非 Volatile 类型的缓冲循环 | Volatile 类型的缓冲循环 |
---|---|
int buffer_full; | volatile int buffer_full; |
表 4.6 显示了 表 4.1 通过编译之后相应的汇编程序。这些C代码在编译时,编译器采用优化选项 -O2
。
Table 4.6. 和非 volatile类型的缓冲循环汇编程序
非 Volatile 类型的缓冲循环 | Volatile 类型的缓冲循环 |
---|---|
read_stream PROC | read_stream PROC LDR r1, |L1.28| |
在非 volatile 类型的缓冲循环 表 4.6 中, 语句 LDR r0, [r0, #0]
在循环标号 |L1.8|
之外将 buffer_full
的值装载到寄存器 r0
。因为 buffer_full
没有定义成 volatile,编译器认为该值不能在程序之外被修改。当已经把 buffer_full
的值读入到寄存器 r0
后,如果使能优化编译器将不再从内存里重新装载该值,因为它的值不能在程序之外改变。结果是造成无限循环。
相反,在 volatile 类型的缓冲循环汇编代码中编译器认为 buffer_full
可能随时改变,因此对它不作优化操作。相应地,在循环标号|L1.4|
之内将变量 buffer_full
装载到寄存器 r0
。因而这是一个正确的汇编代码。
当一个变量的值可能在应用程序不知道的情况下可能改变其值,为了避免优化带来的问题,需要将其定义为 volatile 类型。当有以下情况时需要定义为 volatile 类型的变量:
-
访问内存映射的外围设备
-
在不同的进程之间共用全局变量
-
在中断服务程序中访问全局变量。