以一段简单的函数调用开始,看看程序的上下文是如何切换的。
工具:Keil5
平台:Cortex-M7
1. 简单函数调用
1 int func(int a, int b, int c, int d, int e, int f) 2 { 3 int buf[100]; 4 int i = a + b + c + d + e + f; 5 6 if (a&b&c&d&e&f == 0) 7 { 8 buf[i] = a+b+c+d+e+f; 9 i+= buf[i]; 10 } 11 else 12 { 13 //i += func(a-1, b-1, c-1, d-1, e-1, f-1); 14 i += a-b-c-d-e-f; 15 } 16 return i; 17 } 18 19 int main() 20 { 21 int i = 0; 22 int abc_local = 0; 23 24 abc_local = func(5, 6, 7, 8, 9, 10); 25 26 return abc_local; 27 }
编译成功后仿真,看看汇编里做了啥:
1. 当程序执行到24行时,首先将func()的传参从右向左扫描暂存入寄存器中,传参多达6个,而寄存器R0-R3不够用(备注1),只好将最末尾两个传参压入栈中(栈指针会偏移8个字节,备注2)。
1 0x0800031A 200A MOVS r0,#0x0A 2 0x0800031C 2109 MOVS r1,#0x09 3 0x0800031E 2308 MOVS r3,#0x08 4 0x08000320 2207 MOVS r2,#0x07 5 0x08000322 E9CD1000 STRD r1,r0,[sp,#0] 6 0x08000326 2106 MOVS r1,#0x06 7 0x08000328 2005 MOVS r0,#0x05 8 0x0800032A F7FFFFC8 BL.W func (0x080002BE)
2. 进入func函数内,首先将R4-R7寄存器及 lr 链接地址压入栈中(备注3),然后为数组buf开辟内存空间,开辟方式是直接将sp栈指针偏移0x190=400字节。
接下来的第8行处要使用到6个传参,因此6/7行处将栈中的两个值取出来赋给了R6、R5,可看到此处对sp的指针分别偏移了0x1A8、0x1A4字节,刚好就是(0x190 + (R4-R7)*4 + lr*4)的长度,偏移回了传参压栈时的位置。
1 54: { 2 55: int buf[100]; 3 0x080002BE B5F0 PUSH {r4-r7,lr} 4 0x080002C0 B0E4 SUB sp,sp,#0x190 5 0x080002C2 4604 MOV r4,r0 6 0x080002C4 9E6A LDR r6,[sp,#0x1A8] 7 0x080002C6 9D69 LDR r5,[sp,#0x1A4] 8 56: int i = a + b + c + d + e + f; 9 57: 10 0x080002C8 1867 ADDS r7,r4,r1 11 0x080002CA 4417 ADD r7,r7,r2 12 0x080002CC 441F ADD r7,r7,r3 13 0x080002CE 442F ADD r7,r7,r5 14 0x080002D0 19B8 ADDS r0,r7,r6
备注1.
备注2.
备注3.
2. 函数递归调用
若将func() 函数中的第14行注释掉,换成第十三行的递归调用,则栈的情况又如何呢?编译下看看效果。