GDB调试多线程

2023-12-11 18:41:45

GDB多线程调试的基本命令。

info threads	显示当前可调试的所有线程，每个线程会有一个GDB为其分配的ID，后面操作线程的时候会用到这个。前面有*的是当前调试的线程。
thread ID	切换当前调试的线程为指定ID的线程。
break thread_test.c:123 thread all	在所有线程中相应的行上设置断点
thread apply ID1 ID2 command	让一个或者多个线程执行GDB命令command。
thread apply all command	让所有被调试线程执行GDB命令command。
set scheduler-locking off\|on\|step	估计是实际使用过多线程调试的人都可以发现，在使用step或者continue命令调试当前被调试线程的时候，其他线程也是同时执行的，怎么只让被调试程序执行呢？通过这个命令就可以实现这个需求。off 不锁定任何线程，也就是所有线程都执行，这是默认值。 on 只有当前被调试程序会执行。 step 在单步的时候，除了next过一个函数的情况(熟悉情况的人可能知道，这其实是一个设置断点然后continue的行为)以外，只有当前线程会执行。

gdb对于多线程程序的调试有如下的支持：

线程产生通知：在产生新的线程时, gdb会给出提示信息

(gdb) r
Starting program: /root/thread
[New Thread 1073951360 (LWP 12900)]
[New Thread 1082342592 (LWP 12907)]---以下三个为新产生的线程
[New Thread 1090731072 (LWP 12908)]
[New Thread 1099119552 (LWP 12909)]

查看线程：使用info threads可以查看运行的线程。

注意，行首的数字为gdb分配的线程号，对线程进行切换时，使用该该号码。

另外，行首的星号标识了当前活动的线程

切换线程：使用 thread THREADNUMBER 进行切换，THREADNUMBER 为上文提到的线程号。下例显示将活动线程从 1 切换至 4。

(gdb) info threads
   4 Thread 1099119552 (LWP 12940)   0xffffe002 in ?? ()
   3 Thread 1090731072 (LWP 12939)   0xffffe002 in ?? ()
   2 Thread 1082342592 (LWP 12938)   0xffffe002 in ?? ()
* 1 Thread 1073951360 (LWP 12931)   main (argc=1, argv=0xbfffda04) at thread.c:21
(gdb) thread 4
[Switching to thread 4 (Thread 1099119552 (LWP 12940))]#0   0xffffe002 in ?? ()
(gdb) info threads
* 4 Thread 1099119552 (LWP 12940)   0xffffe002 in ?? ()
   3 Thread 1090731072 (LWP 12939)   0xffffe002 in ?? ()
   2 Thread 1082342592 (LWP 12938)   0xffffe002 in ?? ()
   1 Thread 1073951360 (LWP 12931)   main (argc=1, argv=0xbfffda04) at thread.c:21
(gdb)

后面就是直接在你的线程函数里面设置断点,然后continue到那个断点,一般情况下多线程的时候,由于是同时运行的,最好设置 set scheduler-locking on

这样的话,只调试当前线程

--------------------------------------------------------------------------------------------------------------

二.实战片

调试程序:

[cpp] view plain copy

#include<stdio.h>
#include <stdlib.h>
#include <pthread.h>
#include <unistd.h>
void * fun1 (void *arg1)
{
printf ("[pthread1] -- start\n");
sleep (2);
printf ("[pthread1] -- end\n");
pthread_exit ((void *) NULL);
}
void * fun2 (void *arg1)
{
printf ("[pthread2] -- start\n");
sleep (2);
printf ("[pthread2] -- end\n");
pthread_exit ((void *) NULL);
}
int main(void)
{
pthread_t pid1, pid2;
void *tmp;
printf ("[main] -- start\n");
if (pthread_create (&pid1, NULL, fun1, NULL)) {
perror ("create pthread1 error\n");
exit (1);
}
if (pthread_create (&pid2, NULL, fun2, NULL)) {
perror ("create pthread2 error\n");
exit (1);
}
if (pthread_join (pid1, &tmp)) {
perror ("join pthread1 error\n");
exit (1);
}
if (pthread_join (pid2, &tmp)) {
perror ("join pthread2 error\n");
exit (1);
}
sleep (2);
printf ("[main] -- end\n");
return 0;
}

本程序有3个线程， main 线程先执行，然后创建2个子线程。创建后main 线程等子线程结束，最后再退出。

多线程程序的顺序是未知的，但我们用gdb 调试，可以指定每个线程的前后顺序。以这个例子为例： main 线程创建完 pthread2 和 pthread3 后，不知道

pthread2 先执行，还是 pthread3 先执行，也不知道是pthread2 先结束还是pthread3 先结束。但我们这次调试，等main 线程创建完pthread2 后，先指定

pthread2 先执行，先调试它，等pthread2结束了，再调试pthread3，最后返回调试main线程

[plain] view plain copy

(gdb) b 28 # 先在main 线程设置断点，设置到创建 pthread2 线程处
Breakpoint 1 at 0x4007dc: file d.c, line 28.
30 if (pthread_create (&pid1, NULL, fun1, NULL)) {

[plain] view plain copy

(gdb) set scheduler-locking on # 在创建pthread2 后，线程的执行顺序就不定了，所以我们先设置 scheduler ,指定<单一线程调试>模式

[plain] view plain copy

(gdb) n # 在这步，pthread2线程已经创建，main线程停在创建pthread3线程处。由于我们是单线程调试，所以pthread2虽然创建了，但没执行
[New Thread 0x7ffff7fe5700 (LWP 25412)]
34 if (pthread_create (&pid2, NULL, fun2, NULL)) {

[plain] view plain copy

(gdb) info thread # 察看线程信息，现在main 创建了pthread2 线程，所以有两个线程，我们目前在调试1线程(就是main线程, 星号代表当前线程)
Id Target Id Frame
2 Thread 0x7ffff7fe5700 (LWP 25412) "a.out" 0x0000003bd880dd9c in __lll_lock_wait_private () from /lib64/libpthread.so.0
* 1 Thread 0x7ffff7fe6740 (LWP 25409) "a.out" main () at d.c:34