第5章不要让线程成为脱缰的野马（Keeping your Threads on Leash） ---干净的终止一个线程

2024-04-06 16:27:01

干净的终止一个线程

　　我曾经在第２章产生一个后台线程，用以输出一张屏幕外的 bitmap 图。我们必须解决的一个最复杂的问题就是，如果用户企图结束程序，而这张bitmap 图尚未完成，怎么办？第２章的一个鸵鸟做法就是在任何 worker 线程还没完成其工作之前，不准用户结束程序。只要修改主消息循环，使消息循环不得在任何一个 worker 线程尚未结束之前结束，即可办到。这种做法的最大优点就是“简单”，但万一 bitmap 图十分复杂，需要很长的工作时间，那么程序有可能看起来像是“挂”了一样。

利用TerminateThread() 放弃一个线程

这正是 Win32 程序设计的一般性问题。我如何能够安全地关闭任何执行中的线程呢？最明显的答案就是利用 TerminateThread()：
   BOOL TerminateThread(
       HANDLE hThread,
       DWORD dwExitCode
   );
   参数
   hThread    欲令其结束之线程的 handle。该线程就是我们的行动目标。
   dwExitCode    该线程的结束代码。
   返回值
       如果函数成功，则传回 TRUE。如果失败，则传回 FALSE。GetLastError()可以获知更多细节。
   TerminateThread() 看起来不错，直到我读了一份文件，上面说：“TerminateThread() 是一个危险的函数，应该在最不得已的情况下才使用”。这是一个非常明白的警告。
   TerminateThread() 强迫其行动目标（一个线程）结束，手段激烈而有力，甚至不允许该线程有任何“挣扎”的机会。这带来的副作用便是，线程没有机会在结束前清理自己。对线程而言，这可能导致前功尽弃。这个函数不会在目标线程中丢出一个异常情况（exception），目标线程在核心层面就被根本抹杀了。目标线程没有机会捕捉所谓的“结束请求”，并从而获得清理自己的机会。
   还有另一个令人不愉快的情况。目标线程的堆栈没有被释放掉，于是可能会引起一大块内存泄漏（memory leak）。而且，任何一个与此线程有附着关系的 DLLs 也都没有机会获得“线程解除附着”的通知。
   此函数唯一可以预期并依恃的是，线程 handle 将变成激发状态（译注：因为线程结束了），并且传回 dwExitCode 所指定的结束代码。
   这个函数所带来的隐伏危机还包括：如果线程正进入一个 critical section 之中，该 critical section 将因此永远处于锁定状态，因为 critical section 不像mutex 那样有所谓的 "abandoned" 状态。如果目标线程正在更新一份数据结构，这份数据结构也将永远处于不稳定状态。没有任何方法可以阻止这些问题的发生。
       我的结论是：离 TerminateThread() 远远地！

使用信号（Signals）
   下一个似乎可行的想法是使用 signals。在 Unix 系统中，signals 是跨进程传送通告（notifications）的标准方法。在 Unix 系统中 SIGTERM 相当于“请你离开”的意思，SIGKILL 则是粗略相当于 TerminateThread()。
   这个点子似乎不错，因为 C runtime library 支持标准的 signals，如SIGABRT 和 SIGINT。各种 signals 的处理函数可以利用 C 函数 signal() 设立之。
   但是我很快就进入了一个死胡同。C runtime 函数中没有一个名为 kill()，而那是 Unix 系统藉以送出 signal 的操作。是有一个 raise() 啦，但只能够传送 signal 给目前的线程。
   观察过 C runtime library 的源代码之后，我发现 signals 其实是利用Win32 的异常情况（exceptions）模拟的，Win32 之中并没有真正的 signals，所以这个想法也行不通。

跨越线程，丢出异常情况（Exceptions）
我真正要做的就是在目标线程中引发一个异常情况（exception）。如果有必要在结束前清理某些东西，目标线程可以设法捕捉此一异常情况，否则它可以什么都不管地直接结束自己的生命。
经过数个小时的努力之后，我可以很确定地告诉各位，Win32 API 中没有什么标准方法可以把一个异常情况丢到另一个线程中。真是不幸，因为这样的行为正是我们所需要的。
对专家而言… 关于“模拟丢出一个异常情况到另一个线程”的做法，在 Usenet 上有广泛的讨论。技术之一是利用 debugging API 写一个不合法的指令到目标线程的目前地址上。另一种做法是改变一个常用的指针，使它指向一个不合法地址，因而强迫程序代码产生一个异常情况。这两种做法都有缺点，但当你别无它途时，不妨一试。

设立一个标记
   当所有方法都失败时，不妨返朴归真，回到最简单最明白的路上。Win32 核准的做法是在你的程序代码中设立一个标记，利用其值来要求线程结束自己。
   这个技术有十分明显的优点，可以保证目标线程在结束之前有安全而一致的状态。其缺点也十分明显：线程需要一个 polling 机制，时时检查标记值，以决定该不该结束自己。此刻的你听到 “polling” 会不会有毛骨悚然的感觉？不不，我们并不是要写一个 busy loop 来检验标记值，我们的做法是使用一个手动重置（manual-reset）的 event 对象。Worker 线程可以检查该 event 对象的状态或是等待它，视情况而定。
   结束一个线程，听起来好容易，但是结束程序必须按次序进行，以避免发生 race conditions。让程序依次序进行是非常重要的，特别是在程序要结束之前。结束一个程序就好像拆除一栋建筑物一样，在你以推土机轧平它之前，你必须确定每一个人都安全离开了屋子。结束一个程序也是这样，每一个线程都*结束，不管它进行到哪里。
   让我们看一个简单的例子。列表5-1 的范例程序中，THRDTERM 产生两个线程，周期性地检查一个 event 对象，以决定要不要结束自己。程序代码非常类似第３章的 BUSY2。
列表5-1 THRDTERM—干净地结束一个线程
#0001 /*
#0002 * ThrdTerm.c
#0003 *
#0004 * Sample code for "Multithreading Applications in Win32"
#0005 * This is from Chapter 5, Listing 5-1
#0006 *
#0007 * Demonstrates how to request threads to exit.
#0008 *
#0009 * Build command: cl /MD ThrdTerm.c
#0010 */
#0011
#0012 #define WIN32_LEAN_AND_MEAN
#0013 #include <stdio.h>
#0014 #include <stdlib.h>
#0015 #include <windows.h>
#0016 #include <time.h>
#0017 #include "MtVerify.h"
#0018
#0019 DWORD WINAPI ThreadFunc(LPVOID);
#0020
#0021 HANDLE hRequestExitEvent = FALSE;
#0022
#0023 int main()
#0024 {
#0025        HANDLE hThreads[2];
#0026        DWORD dwThreadId;
#0027        DWORD dwExitCode = 0;
#0028        int i;
#0029
#0030        hRequestExitEvent = CreateEvent(
#0031        NULL, TRUE, FALSE, NULL);
#0032
#0033        for (i=0; i<2; i++)
#0034            MTVERIFY( hThreads[i] = CreateThread(NULL,
#0035                    0,
#0036                    ThreadFunc,
#0037                    (LPVOID)i,
#0038                    0,
#0039                    &dwThreadId )
#0040        );
#0041
#0042 // Wait around for awhile, make
#0043 // sure the thread is running.
#0044        Sleep(1000);
#0045
#0046        SetEvent(hRequestExitEvent);
#0047        WaitForMultipleObjects(2, hThreads, TRUE, INFINITE);
#0048
#0049        for (i=0; i<2; i++)
#0050            MTVERIFY( CloseHandle(hThreads[i]) );
#0051
#0052        return EXIT_SUCCESS;
#0053 }
#0054
#0055
#0056 DWORD WINAPI ThreadFunc(LPVOID p)
#0057 {
#0058        int i;
#0059        int inside = 0;
#0060
#0061        UNREFERENCED_PARAMETER(p);
#0062
#0063 /* Seed the random-number generator */
#0064        srand( (unsigned)time( NULL ) );
#0065
#0066        for (i=0; i<1000000; i++)
#0067        {
#0068            double x = (double)(rand())/RAND_MAX;
#0069            double y = (double)(rand())/RAND_MAX;
#0070            if ( (x*x + y*y) <= 1.0 )
#0071                inside++;
#0072            if(WaitForSingleObject(hRequestExitEvent, 0) != WAIT_TIMEOUT)
#0073            {
#0074               printf("Received request to terminate\n");
#0075                return (DWORD)-1;
#0076            }
#0077        }
#0078        printf("PI = %.4g\n", (double)inside / i * 4);
#0079       return 0;
#0080 }
   首先请注意，event 对象已经被用来取代一个简单的全局变量了。这个例子并不一定需要 event 对象，但如果我们使用它，worker 线程就能够在必要时候等待之。例如 worker 线程可以利用 event 对象来等待一个 Internetsocket 的连接成功，或是等待用户发出离开的请求。我们只要把上述 worker线程中的 WaitForSingleObject() 改为 WaitForMultipleObjects() 即可。
   第二个要注意的是，所有线程共用同一个 event 对象。如果程序尝试要结束，没有必要再为每一个线程产生一个各别通告机制。因为所有的线程都必须立刻被通告。其他情况下可能需要更好的控制。
   最后一点，请注意 main() 所代表的主线程，有一个 WaitForMultipleObjects()操作，等待所有的线程 handles。等待线程 handles 变成激发状态，可以保证线程都已经安全地离开了。虽然本例是无穷等待，但商业软件可能会设一个上限值，例如 15 秒或 30 秒，通常那已经足以表示线程失去了反应。

码农公寓

相关文章