GDB查看堆栈局部变量

2022-09-22 14:53:09

GDB查看堆栈局部变量

“参数从右到左入栈”，“局部变量在栈上分配空间”，听的耳朵都起茧子了。最近做项目涉及C和汇编互相调用，写代码的时候才发现没真正弄明白。自己写了个最简单的函数，用gdb跟踪了调用过程，才多少懂了一点。

参考资料：

http://blog.csdn.net/liigo/archive/2006/12/23/1456938.aspx

http://blog.csdn.net/eno_rez/archive/2008/03/08/2158682.aspx

int add(int x, int y)

{

int a = 0;

a = x;

a += y;

return a;

}

int main(int argc, char *argv[])

{

int x, y, result;

x = 0x12;

y = 0x34;

result = add(x, y);

return 0;

}

编译：(Fedora6, gcc 4.1.2)

[test]$ gcc -g -Wall -o stack stack.c

反汇编：

这里的汇编的格式是AT&T汇编，它的格式和我们熟悉的汇编格式不太一样，尤其要注意源操作数和目的操作数的顺序是反过来的

[test]$ objdump -d stack > stack.dump

[test]$ cat stack.dump

......

08048354 :

8048354: 55 push %ebp ;保存调用者的帧指针

8048355: 89 e5 mov %esp,%ebp ;把当前的栈指针作为本函数的帧指针

8048357: 83 ec 10 sub $0x10,%esp ;调整栈指针，为局部变量保留空间

804835a: c7 45 fc 00 00 00 00 movl $0x0,0xfffffffc(%ebp) ;把a置0。ebp-4的位置是第一个局部变量

8048361: 8b 45 08 mov 0x8(%ebp),%eax ;把参数x保存到eax。ebp+8的位置是最后一个入栈的参数，也就是第一个参数

8048364: 89 45 fc mov %eax,0xfffffffc(%ebp) ;把eax赋值给变量a

8048367: 8b 45 0c mov 0xc(%ebp),%eax ;把参数y保存到eax。ebp+C的位置是倒数第二个入栈的参数，也就是第二个参数

804836a: 01 45 fc add %eax,0xfffffffc(%ebp) ;a+=y

804836d: 8b 45 fc mov 0xfffffffc(%ebp),%eax ;把a的值作为返回值，保存到eax

8048370: c9 leave

8048371: c3 ret

08048372 :

8048372: 8d 4c 24 04 lea 0x4(%esp),%ecx ;？？？？

8048376: 83 e4 f0 and $0xfffffff0,%esp ;把栈指针16字节对齐

8048379: ff 71 fc pushl 0xfffffffc(%ecx) ;？？？？

804837c: 55 push %ebp ;保存调用者的帧指针

804837d: 89 e5 mov %esp,%ebp ;把当前的栈指针作为本函数的帧指针

804837f: 51 push %ecx ;？？？？

8048380: 83 ec 18 sub $0x18,%esp ;调整栈指针，为局部变量保留空间

8048383: c7 45 f0 12 00 00 00 movl $0x12,0xfffffff0(%ebp) ;x=0x12。ebp-16是局部变量x

804838a: c7 45 f4 34 00 00 00 movl $0x34,0xfffffff4(%ebp) ;y=0x34。ebp-12是局部变量y

8048391: 8b 45 f4 mov 0xfffffff4(%ebp),%eax ;y保存到eax

8048394: 89 44 24 04 mov %eax,0x4(%esp) ;y作为最右边的参数首先入栈

8048398: 8b 45 f0 mov 0xfffffff0(%ebp),%eax ;x保存到eax

804839b: 89 04 24 mov %eax,(%esp) ;x第二个入栈

804839e: e8 b1 ff ff ff call 8048354 ;调用add

80483a3: 89 45 f8 mov %eax,0xfffffff8(%ebp) ;把保存在eax的add的返回值，赋值给位于ebp-8的第三个局部变量result。注意这条指令的地址，就是add的返回地址

80483a6: b8 00 00 00 00 mov $0x0,%eax ;0作为main的返回值，保存到eax

80483ab: 83 c4 18 add $0x18,%esp ;恢复栈指针，也就是讨论stdcall和cdecl的时候总要提到的“调用者清栈”

80483ae: 59 pop %ecx ;

80483af: 5d pop %ebp ;

80483b0: 8d 61 fc lea 0xfffffffc(%ecx),%esp ;

80483b3: c3 ret

80483b4: 90 nop

......

有一点值得注意的是main在调用add之前把参数压栈的过程。

它用的不是push指令，而是另一种方法。

在main入口调整栈指针的时候，也就是位于8048380的这条指令 sub $0x18,%esp

不但象通常函数都要做的那样给局部变量预留了空间，还顺便把调用add的两个参数的空间也预留出来了。

然后把参数压栈的时候，用的是mov指令。

我不太明白这种方法有什么好处。

另外一个不明白的就是main入口的四条指令8048372、8048376、8048379、804837f，还有与之对应的main返回之前的指令。

貌似main对esp要求16字节对齐，所以先把原来的esp压栈，然后强行把esp的低4位清0。等到返回之前再从栈里恢复原来的esp

准备工作都做好了，现在开始gdb

对gdb不太熟悉的同学要注意一点，stepi命令执行之后显示出来的源代码行或者指令地址，都是即将执行的指令，而不是刚刚执行完的指令。

我在每个stepi后面都加了注释，就是刚执行过的指令。

[test]$ gdb -q stack

(gdb) break main

Breakpoint 1 at 0x8048383: file stack.c, line 11.

gdb并没有把断点设置在main的第一条指令，而是设置在了调整栈指针为局部变量保留空间之后

(gdb) run

Starting program: /home/*mill/test/stack

Breakpoint 1, main () at stack.c:11

11 x = 0x12;

(gdb) stepi // 注释： movl $0x12,0xfffffff0(%ebp)

12 y = 0x34;

(gdb) stepi // 注释： movl $0x34,0xfffffff4(%ebp)

13 result = add(x, y);

(gdb) info registers esp

esp 0xbf8df8ac 0xbf8df8ac

(gdb) info registers ebp

ebp 0xbf8df8c8 0xbf8df8c8

(gdb) x/12 0xbf8df8a0

0xbf8df8a0: 0x002daff4 0x002d9220 0xbf8df8d8 0x080483e9

0xbf8df8b0: 0x001ca8d5 0xbf8df96c 0x00000012 0x00000034

0xbf8df8c0: 0x001903d0 0xbf8df8e0 0xbf8df938 0x001b4dec

这就是传说中的栈。在main准备调用add之前，先看看这里有些什么东东

0xbf8df8c8(ebp)保存的是上一层函数的帧指针：0xbf8df938，距离这里有112字节

0xbf8df8cc(ebp+4)保存的是main的返回地址0x001b4dec

0xbf8df8b8(ebp-16)是局部变量x，已经赋值0x12;

0xbf8df8bc(ebp-12)是局部变量y，已经赋值0x34;

0xbf8df8c0(ebp-8)是局部变量result。值得注意的是，因为我们没有给result赋值，这里是一个不确定的值。局部变量如果不显式的初始化，初始值不一定是0。

现在开始调用add

(gdb) stepi // 注释： mov 0xfffffff4(%ebp),%eax

0x08048394 13 result = add(x, y);

(gdb) stepi // 注释： mov %eax,0x4(%esp)

0x08048398 13 result = add(x, y);

(gdb) x/12 0xbf8df8a0

0xbf8df8a0: 0x002daff4 0x002d9220 0xbf8df8d8 0x080483e9

0xbf8df8b0: 0x00000034 0xbf8df96c 0x00000012 0x00000034

0xbf8df8c0: 0x001903d0 0xbf8df8e0 0xbf8df938 0x001b4dec

y首先被压栈，在0xbf8df8b0

(gdb) stepi // 注释： mov 0xfffffff0(%ebp),%eax

0x0804839b 13 result = add(x, y);

(gdb) stepi // 注释： mov %eax,(%esp)

0x0804839e 13 result = add(x, y);

(gdb) x/12 0xbf8df8a0

0xbf8df8a0: 0x002daff4 0x002d9220 0xbf8df8d8 0x00000012

0xbf8df8b0: 0x00000034 0xbf8df96c 0x00000012 0x00000034

0xbf8df8c0: 0x001903d0 0xbf8df8e0 0xbf8df938 0x001b4dec

x第二个进栈，在0xbf8df8ac

(gdb) stepi // 注释： call 8048354

add (x=18, y=52) at stack.c:2

2 {

刚刚执行了call指令，现在我们进入了add函数

(gdb) info registers esp

esp 0xbf8df8a8 0xbf8df8a8

(gdb) info registers ebp

ebp 0xbf8df8c8 0xbf8df8c8

(gdb) x/12 0xbf8df8a0

0xbf8df8a0: 0x002daff4 0x002d9220 0x080483a3 0x00000012

0xbf8df8b0: 0x00000034 0xbf8df96c 0x00000012 0x00000034

0xbf8df8c0: 0x001903d0 0xbf8df8e0 0xbf8df938 0x001b4dec

现在esp指向0xbf8df8a8，这里保存的是add函数的返回地址，它是由call指令压栈的。

(gdb) stepi // 注释： push %ebp

0x08048355 2 {

(gdb) stepi // 注释： mov %esp,%ebp

0x08048357 2 {

(gdb) stepi // 注释： sub $0x10,%esp

3 int a = 0;

(gdb) info registers esp

esp 0xbf8df894 0xbf8df894

(gdb) info registers ebp

ebp 0xbf8df8a4 0xbf8df8a4

(gdb) x/16 0xbf8df890

0xbf8df890: 0x00000000 0x08049574 0xbf8df8a8 0x08048245

0xbf8df8a0: 0x002daff4 0xbf8df8c8 0x080483a3 0x00000012

0xbf8df8b0: 0x00000034 0xbf8df96c 0x00000012 0x00000034

0xbf8df8c0: 0x001903d0 0xbf8df8e0 0xbf8df938 0x001b4dec

刚刚执行完的3条指令是函数入口的定式。

现在我们可以看到，main的栈还是原样，向下增长之后就是add的栈。

0xbf8df8a4(ebp)保存的是上层函数main的帧指针

0xbf8df8a8(ebp+4)保存的是返回地址

0xbf8df8ac(ebp+8)保存的是最后一个入栈的参数x

0xbf8df8b0(ebp+C)保存的是倒数第二个入栈的参数y

0xbf8df8a0(ebp-4)保存的是局部变量a，现在是一个不确定值

接下来add函数就真正开始干活了

(gdb) stepi // 注释： movl $0x0,0xfffffffc(%ebp)

4 a = x;

(gdb) x/16 0xbf8df890

0xbf8df890: 0x00000000 0x08049574 0xbf8df8a8 0x08048245

0xbf8df8a0: 0x00000000 0xbf8df8c8 0x080483a3 0x00000012

0xbf8df8b0: 0x00000034 0xbf8df96c 0x00000012 0x00000034

0xbf8df8c0: 0x001903d0 0xbf8df8e0 0xbf8df938 0x001b4dec

可以看到a被置0了

(gdb) stepi // 注释： mov 0x8(%ebp),%eax

0x08048364 4 a = x;

(gdb) stepi // 注释： mov %eax,0xfffffffc(%ebp)

5 a += y;

(gdb) x/16 0xbf8df890

0xbf8df890: 0x00000000 0x08049574 0xbf8df8a8 0x08048245

0xbf8df8a0: 0x00000012 0xbf8df8c8 0x080483a3 0x00000012

0xbf8df8b0: 0x00000034 0xbf8df96c 0x00000012 0x00000034

0xbf8df8c0: 0x001903d0 0xbf8df8e0 0xbf8df938 0x001b4dec

参数x(ebp+8)的值通过eax赋值给了局部变量a(ebp-4)

(gdb) stepi // 注释： mov 0xc(%ebp),%eax

0x0804836a 5 a += y;

(gdb) stepi // 注释： add %eax,0xfffffffc(%ebp)

6 return a;

(gdb) x/16 0xbf8df890

0xbf8df890: 0x00000000 0x08049574 0xbf8df8a8 0x08048245

0xbf8df8a0: 0x00000046 0xbf8df8c8 0x080483a3 0x00000012

0xbf8df8b0: 0x00000034 0xbf8df96c 0x00000012 0x00000034

0xbf8df8c0: 0x001903d0 0xbf8df8e0 0xbf8df938 0x001b4dec

参数y(ebp+C)的值通过eax加到了局部变量a(ebp-4)

现在要从add返回了。返回之前把局部变量a(ebp-4)保存到eax用作返回值

(gdb) stepi // 注释： mov 0xfffffffc(%ebp),%eax

7 }

(gdb) stepi // 注释： leave

0x08048371 in add (x=1686688, y=134513616) at stack.c:7

7 }

(gdb) stepi // 注释： ret

0x080483a3 in main () at stack.c:13

13 result = add(x, y);

现在我们回到了main，栈现在是这样的

(gdb) info registers esp

esp 0xbf8df8ac 0xbf8df8ac

(gdb) info registers ebp

ebp 0xbf8df8c8 0xbf8df8c8

(gdb) x/16 0xbf8df890

0xbf8df890: 0x00000000 0x08049574 0xbf8df8a8 0x08048245

0xbf8df8a0: 0x00000046 0xbf8df8c8 0x080483a3 0x00000012

0xbf8df8b0: 0x00000034 0xbf8df96c 0x00000012 0x00000034

0xbf8df8c0: 0x001903d0 0xbf8df8e0 0xbf8df938 0x001b4dec

可以看到，esp和ebp都已经恢复到了调用add之前的值。

但是，调用add的两个参数还在栈里(0xbf8df8ac、0xbf8df8b0，都在esp以上)。

也就是说，被调用的函数add没有把它们从栈上清出去，需要调用方main来清理。这就是著名的“调用者清栈”，cdecl调用方式的特点之一。

(gdb) stepi // 注释： mov %eax,0xfffffff8(%ebp)

14 return 0;

(gdb) x/16 0xbf8df890

0xbf8df890: 0x00000000 0x08049574 0xbf8df8a8 0x08048245

0xbf8df8a0: 0x00000046 0xbf8df8c8 0x080483a3 0x00000012

0xbf8df8b0: 0x00000034 0xbf8df96c 0x00000012 0x00000034

0xbf8df8c0: 0x00000046 0xbf8df8e0 0xbf8df938 0x001b4dec

从eax得到函数add的返回值，赋值给了局部变量result(ebp-8)

(gdb) stepi // 注释： mov $0x0,%eax ;把eax置0作为main的返回值

15 }

(gdb) stepi // 注释： add $0x18,%esp ; 调用者清栈

0x080483ae 15 }

(gdb) continue

Continuing.

Program exited normally.

(gdb) quit

[test]$

码农公寓

相关文章