VC和gcc不同,不能保证静态变量的线程安全性。这就给我们的程序带来了很大的安全隐患和诸多不便。这一点应该引起我们的重视!尤其是在构造函数耗时比较长的时候,很可能给程序带来意想不到的结果。本文从测试代码开始,逐步分析原理,最后给出解决方案。
多线程状态下,VC不能保证在使用函数的静态变量的时候,它的构造函数已经被执行完毕,下面是一段测试代码:
class TestStatic { public: TestStatic() { Sleep(1000*10); m_num = 999; } public: int m_num; }; DWORD WINAPI TestThread( LPVOID lpParam ) { static TestStatic test; printf("Thread[%d] Num[%d]\n", lpParam, test.m_num); return 0; } int _tmain(int argc, _TCHAR* argv[]) { DWORD dwThreadId; for (int i=1; i<=3; i++) { CreateThread(NULL,0,TestThread,(LPVOID)i,0,&dwThreadId); } for (int i =0; i<10; i++) { Sleep(1000*10000); } return 0; }
测试代码故意在构造函数中制造了一个较长时间的延时,程序运行结果:
Thread[2] Num[0]
Thread[3] Num[0]
Thread[1] Num[999]
结果显示,线程2和线程3在静态变量的构造函数没有执行完毕的时候就已经使用了该变量实例,于是得到了错误的结果。
从下面列出的TestThread函数的反汇编代码不难看出问题所在。静态变量实例不存在的时候,程序会生成一个实例然后调用构造函数。当实例存在的时候直接就跳过生成实例和调用构造函数两个步骤。
结合上面的输出结果,线程1最先调用函数TestThread,因此生成了实例test并且开始调用TestStatic类构造函数,构造函数卡在了sleep上。再此之后,线程2和线程3先后来调用TestThread函数,但是此时虽然构造函数没有执行完毕,但是静态变量的实例已经存在,所以跳过了生成实例和调构造函数,直接来到了printf函数的调用处,输出了没有初始化的变量值(这里是0)。当sleep完成后,构造函数执行完毕,变量值被设置为999,只有线程1得到了正确的结果999。
static TestStatic test;
00D48A7D mov eax,dword ptr [$S1 (0D9EA94h)]
00D48A82 and eax,1
00D48A85 jne TestThread+6Ch (0D48AACh)
00D48A87 mov eax,dword ptr [$S1 (0D9EA94h)]
00D48A8C or eax,1
00D48A8F mov dword ptr [$S1 (0D9EA94h)],eax
00D48A94 mov dword ptr [ebp-4],0
00D48A9B mov ecx,offset test (0D9EA98h)
00D48AA0 call TestStatic::TestStatic (0D2DF6Dh)
00D48AA5 mov dword ptr [ebp-4],0FFFFFFFFh
printf("Thread[%d] Num[%d]\n", lpParam, test.m_num);
00D48AAC mov esi,esp
00D48AAE mov eax,dword ptr [test (0D9EA98h)]
00D48AB3 push eax
00D48AB4 mov ecx,dword ptr [ebp+8]
00D48AB7 push ecx
00D48AB8 push offset string "thread[%d] num[%d]" (0D8A0A0h)
00D48ABD call dword ptr [MSVCR90D_NULL_THUNK_DATA (0DA0B3Ch)]
……
类似的代码,我们在linux上用gcc编译程序,看看效果如何:
class TestStatic { public: TestStatic() { sleep(10); m_num = 999; } public: int m_num; }; static void* TestThread( void* lpParam ) { static TestStatic test; printf("Thread[%d] Num[%d]\n", lpParam, test.m_num); return 0; } int main (int argc, char *argv[]) { pthread_attr_t ThreadAttr; pthread_attr_init(&ThreadAttr); pthread_attr_setdetachstate(&ThreadAttr, PTHREAD_CREATE_DETACHED); pthread_t tid; for (int i=1; i<=3; i++) { pthread_create(&tid, &ThreadAttr, TestThread, (void*)i); } sleep(60*60*24); return(0); }
最终的结果显示,gcc编译出的程序和VC出现不同结果,每个线程都得到了正确的数值,可见gcc是真正保证了函数内部静态变量的线程安全性的,程序运行结果如下:
Thread[3] Num[999]
Thread[2] Num[999]
Thread[1] Num[999]
同样,我们从TestThread函数的反汇编代码代码来分析问题。不难看出,gcc和VC最大的区别就在于call 0x400a50 <__cxa_guard_acquire@plt>,这一行代码。gcc在创建静态变量实例之前先要获取锁,并且构造函数执行完毕才认为实例创建成功。显然,这个锁是gcc自动添加上的代码。因此,构造函数没有执行完毕,所有线程都不能获取到test变量,也就不会像VC程序一样输出错误的结果了。
0x40195a push rbp
0x40195b mov rbp,rsp
0x40195e push r12
0x401960 push rbx
0x401961 sub rsp,0x10
0x401965 mov QWORD PTR [rbp-0x18],rdi
0x401969 mov eax,0x6031f0
0x40196e movzx eax,BYTE PTR [rax]
0x401971 test al,al
0x401973 jne 0x4019a2 <TestThread(void*)+72>
0x401975 mov edi,0x6031f0
0x40197a call 0x400a50 <__cxa_guard_acquire@plt>
0x40197f test eax,eax
0x401981 setne al
0x401984 test al,al
0x401986 je 0x4019a2 <TestThread(void*)+72>
0x401988 mov r12d,0x0
0x40198e mov edi,0x6031f8
0x401993 call 0x401b06 <TestStatic::TestStatic()>
0x401998 mov edi,0x6031f0
0x40199d call 0x400ae0 <__cxa_guard_release@plt>
0x4019a2 mov edx,DWORD PTR [rip+0x201850] # 0x6031f8 <_ZZL10TestThreadPvE4test>
0x4019a8 mov rax,QWORD PTR [rbp-0x18]
0x4019ac mov rsi,rax
0x4019af mov edi,0x401d9c
0x4019b4 mov eax,0x0
0x4019b9 call 0x400a40 <printf@plt>
0x4019be mov eax,0x0
0x4019c3 add rsp,0x10
0x4019c7 pop rbx
0x4019c8 pop r12
0x4019ca pop rbp
0x4019cb ret
0x4019cc mov rbx,rax
0x4019cf test r12b,r12b
0x4019d2 jne 0x4019de <TestThread(void*)+132>
0x4019d4 mov edi,0x6031f0
0x4019d9 call 0x400b40 <__cxa_guard_abort@plt>
0x4019de mov rax,rbx
0x4019e1 mov rdi,rax
0x4019e4 call 0x400b70 <_Unwind_Resume@plt>
大家都喜欢使用Singleton模式,用的时候图方便,也喜欢直接在函数里面直接用个静态变量。有的时候也必须使用静态变量,比如需要在程序退出的时候执行析构函数的情况。
但是多线程状态下,VC和gcc不同,不能保证静态变量的线程安全性。VC的这个缺陷导致我们在使用Singleton模式的时候,不能像gcc一样直接采用静态函数成员变量的方式。这就给我们的程序带来了很大的安全隐患和诸多不便。这一点应该引起我们的重视!尤其是在构造函数耗时比较长的时候,很可能给程序带来意想不到的结果。我们必须使用变通的方法,自己来控制类的初始化过程。
以前我在解决这个问题的时候就是直接定义一个全局变量的锁,但是定义全局变量代码不够美观,毕竟不是一个好的风格。同时,加锁解锁也相当影响效率。
下面我给出一个可以作为固定模式使用的范例代码供大家参考,基本思路就是利用函数内部的一个基本类型的变量来控制复杂实例的生成:
class ClassStatic { public: ClassStatic() { Sleep(1000*10); m_num = 999; } public: int m_num; }; DWORD WINAPI TestThread( LPVOID lpParam ) { static volatile long single = 1; while(single != 0) { if (1 == _InterlockedCompareExchange(&single, 2, 1)) { break; } else { for ( unsigned int i = 0; i < 1024; i++ ) { _mm_pause(); } while (single != 0) { Sleep(1); } } } static ClassStatic test; single && (single = 0); printf("Thread[%d] Num[%d]\n", lpParam, test.m_num); return 0; }
这次的运行结果就正确了:
Thread[3] Num[999]
Thread[2] Num[999]
Thread[1] Num[999]