一.前言
1.编译器优化介绍:
由于内存訪问速度远不及CPU处理速度,为提高机器总体性能,在硬件上引入硬件快速缓存Cache,加速对内存的訪问。另外在现代CPU中指令的运行并不一定严格依照顺序运行,没有相关性的指令能够乱序运行,以充分利用CPU的指令流水线,提高运行速度。以上是硬件级别的优化。再看软件一级的优化:一种是在编写代码时由程序猿优化,还有一种是由编译器进行优化。编译器优化经常使用的方法有:将内存变量缓存到寄存器;调整指令顺序充分利用CPU指令流水线,常见的是又一次排序读写指令。对常规内存进行优化的时候,这些优化是透明的,并且效率非常好。由编译器优化或者硬件又一次排序引起的问题的解决的方法是在从硬件(或者其他处理器)的角度看必须以特定顺序运行的操作之间设置内存屏障(memory barrier),linux 提供了一个宏解决编译器的运行顺序问题。
void Barrier(void)
这个函数通知编译器插入一个内存屏障,但对硬件无效,编译后的代码会把当前CPU寄存器中的全部改动过的数值存入内存,须要这些数据的时候再又一次从内存中读出。
2.volatile总是与优化有关,编译器有一种技术叫做数据流分析,分析程序中的变量在哪里赋值、在哪里使用、在哪里失效,分析结果能够用于常量合并,常量传播等优化,进一步能够消除一些代码。但有时这些优化不是程序所须要的,这时能够用volatilekeyword禁止做这些优化。
二.volatile具体解释:
1.volatile的本意是“易变的” 由于訪问寄存器要比訪问内存单元快的多,所以编译器一般都会作降低存取内存的优化,但有可能会读脏数据。当要求使用volatile声明变量值的时候,系统总是又一次从它所在的内存读取数据,即使它前面的指令刚刚从该处读取过数据。精确地说就是,遇到这个keyword声明的变量,编译器对訪问该变量的代码就不再进行优化,从而能够提供对特殊地址的稳定訪问;假设不使用valatile,则编译器将对所声明的语句进行优化。(简洁的说就是:volatile关键词影响编译器编译的结果,用volatile声明的变量表示该变量随时可能发生变化,与该变量有关的运算,不要进行编译优化,以免出错)
2.看两个事例:
1>告诉compiler不能做不论什么优化
比方要往某一地址送两指令:
int *ip =...; //设备地址
*ip = 1; //第一个指令
*ip = 2; //第二个指令
以上程序compiler可能做优化而成:
int *ip = ...;
*ip = 2;
结果第一个指令丢失。假设用volatile, compiler就不允许做不论什么的优化,从而保证程序的原意:
volatile int *ip = ...;
*ip = 1;
*ip = 2;
即使你要compiler做优化,它也不会把两次付值语句间化为一。它仅仅能做其他的优化。
2>用volatile定义的变量会在程序外被改变,每次都必须从内存中读取,而不能重复使用放在cache或寄存器中的备份。
比如:
volatile char a;
a=0;
while(!a){
//do some things;
}
doother();
假设没有 volatiledoother()不会被运行
3.以下是使用volatile变量的几个场景:
1>中断服务程序中改动的供其他程序检測的变量须要加volatile;
比如:
static int i=0;
int main(void)
{
...
while (1){
if (i) dosomething();
}
}
/* Interrupt service routine. */
void ISR_2(void)
{
i=1;
}
程序的本意是希望ISR_2中断产生时,在main函数中调用dosomething函数,可是,由于编译器推断在main函数里面没有改动过i,因此可能仅仅运行一次对从i到某寄存器的读操作,然后每次if推断都仅仅使用这个寄存器里面的“i副本”,导致dosomething永远也不会被调用。假设将变量加上volatile修饰,则编译器保证对此变量的读写操作都不会被优化(肯定运行)。此例中i也应该如此说明。
2>多任务环境下各任务间共享的标志应该加volatile
3>存储器映射的硬件寄存器通常也要加voliate,由于每次对它的读写都可能有不允许义。
比如:
假设要对一个设备进行初始化,此设备的某一个寄存器为0xff800000。
int *output = (unsigned int *)0xff800000;//定义一个IOport;
int init(void)
{
int i;
for(i=0;i< 10;i++){
*output = i;
}
}
经过编译器优化后,编译器觉得前面循环半天都是废话,对最后的结果毫无影响,由于终于仅仅是将output这个指针赋值为9,所以编译器最后给你编译编译的代码结果相当于:
int init(void)
{
*output = 9;
}
假设你对此外部设备进行初始化的过程是必须是像上面代码一样顺序的对其赋值,显然优化过程并不能达到目的。反之假设你不是对此port重复写操作,而是重复读操作,其结果是一样的,编译器在优化后,或许你的代码对此地址的读操作仅仅做了一次。然而从代码角度看是没有不论什么问题的。这时候就该使用volatile通知编译器这个变量是一个不稳定的,在遇到此变量时候不要优化。
比如:
volatile int *output=(volatile unsigned int *)0xff800000;//定义一个I/Oport
另外,以上这几种情况经常还要同一时候考虑数据的完整性(相互关联的几个标志读了一半被打断了重写),在1中能够通过关中断来实现,2中禁止任务调度,3中则仅仅能依靠硬件的良好设计。
4.几个问题
1)一个參数既能够是const还能够是volatile吗?
能够的,比如仅仅读的状态寄存器。它是volatile由于它可能被意想不到地改变。它是const由于程序不应该试图去改动它。
2) 一个指针能够是volatile 吗?
能够,当一个中服务子程序修该一个指向一个buffer的指针时。
5.volatile的本质:
1> 编译器的优化
在本次线程内, 当读取一个变量时,为提高存取速度,编译器优化时有时会先把变量读取到一个寄存器中;以后,再取变量值时,就直接从寄存器中取值;当变量值在本线程里改变时,会同一时候把变量的新值copy到该寄存器中,以便保持一致。
当变量在因别的线程等而改变了值,该寄存器的值不会对应改变,从而造成应用程序读取的值和实际的变量值不一致。
当该寄存器在因别的线程等而改变了值,原变量的值不会改变,从而造成应用程序读取的值和实际的变量值不一致。
2>volatile应该解释为“直接存取原始内存地址”比較合适,“易变的”这样的解释简直有点误导人。
6.以下的函数有什么错误:
int square(volatile int *ptr)
{
return *ptr * *ptr;
}
该程序的目的是用来返指针*ptr指向值的平方,可是,由于*ptr指向一个volatile型參数,编译器将产生相似以下的代码:
int square(volatile int *ptr)
{
int a,b;
a = *ptr;
b = *ptr;
return a * b;
}
由于*ptr的值可能被意想不到地该变,因此a和b可能是不同的。结果,这段代码可能返不是你所期望的平方值!正确的代码例如以下:
long square(volatile int *ptr)
{
int a;
a = *ptr;
return a * a;
}
注意:频繁地使用volatile非常可能会添加代码尺寸和降低性能,因此要合理的使用volatile。