静态链接过程

2023-11-08 17:02:58

转自：博客1， http://chuquan.me/2018/06/03/linking-static-linking-dynamic-linking/

1.为什么需要重定位？

执行函数：

程序的运行过程就是CPU不断的从内存中取出指令然后执行的过程。

假设对g_num做++操作，那么汇编指令：

call 0x4004fd    #地址为函数add在内存中的地址，调用时会跳转到0x4004fd来执行指令函数add对应的机器指令
mov 0x400fda %eax   #将0x400fda地址的内容放到eax寄存器中，g_num的地址就是0x400fda
add $0x1 %eax   #将寄存器内容+1

那么地址从哪里获取？确定程序运行时地址的过程就是 重定位(Relocation)。

2.编译为 .o文件的过程

目标文件.o包括：

数据段：全局变量的定义
代码段：所有函数的定义
符号表：对外部变量的引用

编译过程可以确定：

定义在该源文件中函数的内存地址
定义在该源文件中全局变量的内存地址

//都是针对本文件内部的相对地址

而如果针对引用其他文件中定义的变量或函数，那么编译时就将调用的地址设置为空，并且生成一条记录，之后的任务交给链接器。

例如：

// a.c
extern int shared;//引用了其他文件中定义的全局变量

int main() {
    int a = 100;
    swap(&a, &shared);//引用了其他文件中定义的函数
}

// b.c
int shared = 1;

void swap(int *a, int *b) {
    *a ^= *b ^= *a ^= *b;
}

那么在编译为汇编文件.i时，调用其他文件中的函数，汇编指令为空地址，表示不确定：

call 0x000000

并且生成一条记录放在.rel.text中，对外部定义的全局变量的使用，放在.rel.text中，链接器根据上述两者内容填写空白位置。

.o文件内容

对外部函数的引用放在.rel.text中，对外部全局变量的引用放在.rel.data段中。

编译过程确定了该源文件中函数和变量的相对地址，以及引用其他文件的相对地址，需要链接时确定的信息放在.rel.data/.rel.text中，以修正地址。

3.链接器的工作

3.1 重定位第一个过程：链接合并段

链接器会将所有需要的目标文件.o合并，即将对应段合并，这样就能确定相对地址，以更新目标文件中的相对地址。

上图中，蓝色部分表示为代码段，依次合并；

黄色是数据段，主要观察数据段的相对地址变化，目标文件2经过合并更新相对地址后是6，目标文件3经过合并更新相对地址后是8.

相对地址 + offset(偏移) = 最终内存地址

在合并时会产生偏移。段的偏移只有在链接的时候才能确定，因为连接时才会发生段的合并，确定最终地址。编译过程是无法确定的。

3.2 引用符号重定位

已经确定了相对地址和偏移，确定了变量和函数的最终内存地址，所以就可以更新.rel.data/.ref.text的最终值。

其中rel是Relocation Table的缩写，保存着需要重定位的符号，即重定位表。

4.#include的所有都会被包含？

可以认为在静态编译时，形成可执行文件时，会将头文件中的函数也一并有个副本，进行段合并，在代码段合并，共同生成可执行文件。

即每生成一个可执行文件，就会有一份函数的拷贝，在调用时，比如说scanf这样，直接call 最终内存地址即可。

码农公寓