摘自http://blog.csdn.net/elfprincexu/article/details/45043971
gcc/g++等编译器 编译原理: 预处理,编译,汇编,链接各步骤详解
C和C++编译器是集成的,编译一般分为四个步骤:
- 预处理(preprocessing) ----------------- cpp/ gcc -E
- 编译(compilation) ------------------ cc1 / gcc -S
- 汇编(assembly) -------------------- as
- 连接(linking) --------------------- ld
gcc
认为预处理的文件是(.i)是C文件,并且设定C形式的连接;
g++
认为预处理的文件是(.i)是C++文件,并且设定C++形式的连接;
源文件后缀名的一些含义和后续的操作:
- .c C源程序 预处理,编译,汇编
- .C C++源程序 预处理,编译,汇编
- .cc C++源程序
- .cxx C++源程序 预处理,编译,汇编
- .m Objective-C源程序 预处理,编译,汇编
- .i 预处理后的C文件 编译,汇编
- .ii 预处理后的C++文件 编译,汇编
- .s 汇编语言源程序 汇编
- .S 汇编语言源程序 预处理,汇编
- .h 预处理器文件 通常不出现在命令行上
其他后缀名的文件被传递给连接器(linker).通常包括:
.o 目标文件(Object file)
.a 归档库文件(Archive file)
转载请注明出处: http://blog.csdn.net/elfprincexu
二、具体介绍一下GCC编译步骤
首先,有以下hello.c源代码
- #include<stdio.h>
- int main()
- {
- printf("Hello! This is our embedded world!\n");
- return 0;
- }
(1)预处理阶段
在该阶段,编译器将上述代码中的stdio.h编译进来,并且用户可以使用Gcc的选项”-E”进行查看,该选项的作用是让Gcc在预处理结束后停止编译过程。预处理阶段主要处理#include和#define,它把#include包含进来的.h 文件插入到#include所在的位置,把源程序中使用到的用#define定义的宏用实际的字符串代替,我们可以用-E选项要求gcc只进行预处理而不进行后面的三个阶段,
注意 : Gcc指令的一般格式为:Gcc [选项] 要编译的文件 [选项] [目标文件]
其中,目标文件可缺省,Gcc默认生成可执行的文件,命为:编译文件.out
[root@localhost Gcc]# Gcc –E hello.c –o hello.i
在此处,选项"-o"是指目标文件,".i"文件为已经过预处理的C原始程序。以下列出了hello.i文件的部分内容:
- typedef int (*__gconv_trans_fct) (struct __gconv_step *,
- struct __gconv_step_data *, void *,
- __const unsigned char *,
- __const unsigned char **,
- __const unsigned char *, unsigned char **,
- size_t *);
- …
- # 2 "hello.c" 2
- int main()
- {
- printf("Hello! This is our embedded world!\n");
- return 0;
- }
由此可见,Gcc确实进行了预处理,它把”stdio.h”的内容插入到hello.i文件中。
(2)编译阶段
接下来进行的是编译阶段,在这个阶段中,Gcc首先要检查代码的规范性、是否有语法错误等,以确定代码的实际要做的工作,在检查无误后,Gcc把代码翻译成汇编语言。用户可以使用”-S”选项来进行查看,该选项只进行编译而不进行汇编,生成汇编代码。
上面这两步的输出文件都是文本文件,我们可以用诸如cat的文本处理等命令阅读这些输出文件。
[root@localhost Gcc]# Gcc –S hello.i –o hello.s
以下列出了hello.s的内容,可见Gcc已经将其转化为汇编了,感兴趣的读者可以分析一下这一行简单的C语言小程序是如何用汇编代码实现的。
- .file "hello.c"
- .section .rodata
- .align 4
- .LC0:
- .string "Hello! This is our embedded world!"
- .text
- .globl main
- .type main, @function
- main:
- pushl %ebp
- movl %esp, %ebp
- subl $8, %esp
- andl $-16, %esp
- movl $0, %eax
- addl $15, %eax
- addl $15, %eax
- shrl $4, %eax
- sall $4, %eax
- subl %eax, %esp
- subl $12, %esp
- pushl $.LC0
- call puts
- addl $16, %esp
- movl $0, %eax
- leave
- ret
- .size main, .-main
- .ident "GCC: (GNU) 4.0.0 20050519 (Red Hat 4.0.0-8)"
- .section .note.GNU-stack,"",@progbits
(3)汇编阶段
汇编阶段是把编译阶段生成的”.s”文件转成目标文件,读者在此可使用选项”-c”就可看到汇编代码已转化为”.o”的二进制目标代码了。如下所示:
[root@localhost Gcc]# Gcc –c hello.s –o hello.o
(4)链接阶段
在成功编译之后,就进入了链接阶段。在这里涉及到一个重要的概念:函数库。
读者可以重新查看这个小程序,在这个程序中并没有定义”printf”的函数实现,且在预编译中包含进的”stdio.h”中也只有该函数的声明,而没有定义函数的实现,那么,是在哪里实现”printf”函数的呢?最后的答案是:系统把这些函数实现都被做到名为libc.so.6的库文件中去了,在没有特别指定时,Gcc会到系统默认的搜索路径”/usr/lib”下进行查找,也就是链接到libc.so.6库函数中去,这样就能实现函数”printf”了,而这也就是链接的作用。
函数库一般分为静态库和动态库两种。
- 静态库是指编译链接时,把库文件的代码全部加入到可执行文件中,因此生成的文件比较大,但在运行时也就不再需要库文件了。其后缀名一般为”.a”。
- 动态库与之相反,在编译链接时并没有把库文件的代码加入到可执行文件中,而是在程序执行时由运行时链接文件加载库,这样可以节省系统的开销。动态库一般后缀名为”.so”,如前面所述的libc.so.6就是动态库。Gcc在编译时默认使用动态库。
- 说下生成静态库的方法:
- ar cr libxxx.a file1.o file2.o
- 就是把file1.o和file2.o打包生成libxxx.a静态库
- 使用的时候
- gcc test.c -L/path -lxxx -o test
- 动态库的话:
- gcc -fPIC -shared file1.c -o libxxx.so
- 也可以分成两部来写:
- gcc -fPIC file1.c -c //这一步生成file1.o
- gcc -shared file1.o -o libtest.so
静态库链接时搜索路径顺序:
- 1. ld会去找GCC命令中的参数-L
- 2. 再找gcc的环境变量LIBRARY_PATH
- 3. 再找内定目录 /lib /usr/lib /usr/local/lib 这是当初compile gcc时写在程序内的
动态链接时、执行时搜索路径顺序:
- 1. 编译目标代码时指定的动态库搜索路径
- 2. 环境变量LD_LIBRARY_PATH指定的动态库搜索路径
- 3. 配置文件/etc/ld.so.conf中指定的动态库搜索路径
- 4. 默认的动态库搜索路径/lib
- 5. 默认的动态库搜索路径/usr/lib
有关环境变量:
- LIBRARY_PATH环境变量:指定程序静态链接库文件搜索路径
- LD_LIBRARY_PATH环境变量:指定程序动态链接库文件搜索路径
完成了链接之后,Gcc就可以生成可执行文件,如下所示。
[root@localhost Gcc]# Gcc hello.o –o hello
运行该可执行文件,出现正确的结果如下。
[root@localhost Gcc]# ./hello
Hello! This is our embedded world!