apue第七章学习总结##
1.main函数
程序是如何执行有关的c程序的?
C程序总是从main
函数开始执行。main
函数的原型是
int main(int argc,char *argv[]);
其中,argc
是命令行参数的数目,argv
是指向参数的各个指针所构成的数组。
当内核执行C程序时(使用一个exec
函数),在调用main
前先调用一个特殊的启动例程。可执行程序文件将此启动例程指定为程序的起始地址——这是由连接编辑器设置的,而连接编辑器则由C编译器(通常是cc)调用。启动例程从内核取得命令行参数和环境变量值,然后为按上述方式调用main函数做好安排。
2.进程终止
有8种方式使进程终止,其中5种为正常终止,它们是:
- (1).从
main
返回。 - (2).调用
exit
。 - (3).调用
_exit
或_Exit
。 - (4).最后一个线程从其启动例程返回。
- (5).最后一个线程调用
pthread_exit
异常终止有3种方式,它们是:
- (6).调用
abort
; - (7).接到一个信号并终止。
- (8).最后一个线程对取消请求做出响应。
3.C程序的存储空间布局
从历史上讲,C程序一直由下面几部分组成:
- 正文段。这是由CPU执行的机器指令部分。通常,正文段是可共享的,所以即使是频繁执行的程序(如文本编辑器,C编译器和shell等)在存储器中也只需有一个副本,另外,正文段常常是只读的,以防止程序由于意外而修改其自身的指令。
- 初始化数据段。通常将此称为数据段,它包含了程序中需明确地赋初值的变量。例如,C程序中出现在任何函数之外的声明:
int maxcount = 99;
- 非初始化数据段。通常将此段称为bss段,这一名称来源于一个早期的汇编运算符,意思是“block started by symbol"(由符号开始的块),在程序开始执行之前,内核将此段中的数据初始化为0或空指针。出现在任何函数外的C声明
long sum[1000];
- 栈。自动变量以及每次函数调用时所需保存的信息都存放在此段中。每次调用函数时,其返回地址以及调用者的环境变量(例如某些机器寄存器的值)都存放在栈中。然后,最近被调用的函数在栈上为其自动和临时变量分配存储空间。通过以这种方式使用栈,可以递归调用C函数。递归函数每次调用自身时,就使用一个新的栈帧,因此一个函数调用实例中的变量集不会影响另一个函数调用实例中的变量。
- 堆。通常在堆中进行动态存储分配。由于历史上形成的惯例,堆位于非初始化数据段和栈之间。
4.环境变量和环境表
环境字符串的形式通常如下:
name=value
环境表(指向实际name=value
字符串的指针数组)和环境字符串通常存放在进程存储空间的顶部(栈之上)。
5.setjmp和longjmp函数
在C中,goto
语句是不能跨越函数的,而执行这类跳转功能的是函数setjmp
和longjmp
。但是记住,对于longjmp
,大多数实现并不回滚这些自动变量和寄存器变量的值。
6.getrlimit和setrlimit函数
每个进程都有一组资源限制,其中一些可以用getrlimit
和setrlimit
函数查询和更改。
7.习题:
7.1.在Intel x86系统上,无论使用FreeBSD或Linux,如果执行一个输出"hello world"但不调用exit
或return
的程序,则程序的返回代码为13(用shell来grep检查),解释其原因。
原因在于printf
的返回值(输出的字符数)变成了main
函数的返回值。当然,并不是所有的系统都会出现该情况。
7.2.到底printf函数的结果何时才会被真正输出?
当程序处于交互运行方式时,标准输出通常处于行缓冲方式,所以当输出换行符时,上次的结果才被真正输出。如果标准输出被定向到一个文件而处于完全缓冲方式,则当标准I/O清理操作执行时,结果才真正被输出。
7.3.是否有方法不使用(a).参数传递 (b).全局变量这两种方法,将main中的参数argc和argv传递给它所调用的其它函数?
由于 argc
和argv
的副本不像environ
一样保存在全局变量中,所以大多数UNIX系统中没有办法实现。(而有关environ
环境变量的话,可以通过函数getenv
来调用,因为命令行参数和环境变量位于栈之上的高地址)
7.4.在有些UNIX系统中执行程序时访问不到其数据段的单元0(即数据段的起始地址0存储的数据),这是一种有意的安排,为什么?
原因在于当程序上对一个空指针(地址为NULL,即0)进行解引用操作时,可以由于访问不到想要的地址而终止程序,防止程序访问到意想不到的数据,在程序开发中,如果指针指向或者操作了意想不到的数据都会视为危险的行为。
关于空指针的解引用,在网上找到:
空指针解引用是否导致异常应该是硬件设备和OS组合决定的。以前在VXwork下工作,空指针也可以解引用,可以访问内存0地址,还可以修改内容。这种情况下,为了便于程序员debug,印象中我们大概是采用了对于0地址内容监控,如果内容有改动则报告或者crash。
7.5.用C语言的typedef工具为终止处理程序定义一个新数据类型Exitfunc,使用该类型修改atexit的原型。
我们先看一下atexit
的原型:
#include <stdlib.h>
int atexit(void (*func)(void));
所以通过typedef
定义的新的数据类型Exitfunc
如下:
typedef void Exitfunc(void); //定义一个数据类型Exitfunc,指向函数void func(void)的函数入口
int atexit(Exitfunc *func); //改写后的atexit的原型
//注上面的typedef解释如下:
Exitfunc * ptr; //相当于 void (*ptr)(void); //ptr指向函数的入口
另外对于typedef的使用,有如下介绍:
用途一:定义一种类型的别名,而不只是简单的宏替换。
可以用作同时声明指针型的多个对象。比如:
char* pa, pb; // 这多数不符合我们的意图,它只声明了一个指向字符变量的指针,
// 和一个字符变量;
//以下则可行:
typedef char* PCHAR;
PCHAR pa, pb;
这种用法很有用,特别是
char* pa, pb
的定义,初学者往往认为是定义了两个字符型指针,其实不是,而用typedef char* PCHAR
就不会出现这样的问题,减少了错误的发生。
用途二:用在旧的C代码中,帮助struct。
以前的代码中,声明struct新对象时,必须要带上struct,即形式为: struct 结构名对象名,如:
struct tagPOINT1{
int x;
int y;
};
struct tagPOINT1 p1;
而在C++中,则可以直接写:结构名对象名,即:
tagPOINT1 p1;
typedef struct tagPOINT{
int x;
int y;
}POINT;
POINT p1;
这样就比原来的方式少写了一个struct,比较省事,尤其在大量使用的时候,或许,在C++中,typedef的这种用途二不是很大,但是理解了它,对掌握以前的旧代码还是有帮助的,毕竟我们在项目中有可能会遇到较早些年代遗留下来的代码。
用途三:用typedef来定义与平台无关的类型。
比如定义一个叫 REAL 的浮点类型,在目标平台一上,让它表示最高精度的类型为:
typedef long double REAL;
在不支持
long double
的平台二上,改为:
typedef double REAL;
在连
double
都不支持的平台三上,改为:
typedef float REAL;
也就是说,当跨平台时,只要改下
typedef
本身就行,不用对其他源码做任何修改。
标准库就广泛使用了这个技巧,比如size_t。另外,因为typedef是定义了一种类型的新别名,不是简单的字符串替换,所以它比宏来得稳健。
这个优点在我们写代码的过程中可以减少不少代码量哦!
用途四:为复杂的声明定义一个新的简单的别名。
方法是:在原来的声明里逐步用别名替换一部分复杂声明,如此循环,把带变量名的部分留到最后替换,得到的就是原声明的最简化版。举例:
原声明:
void (*b[10]) (void (*)());
变量名为b,先替换右边部分括号里的,pFunParam为别名一:
typedef void (*pFunParam)();
再替换左边的变量b,pFunx为别名二:
typedef void (*pFunx)(pFunParam);
原声明的最简化版:
pFunx b[10];
原声明:
doube(*)() (*e)[9];
变量名为e,先替换左边部分,pFuny为别名一:
typedef double(*pFuny)();
再替换右边的变量e,pFunParamy为别名二
typedef pFuny (*pFunParamy)[9];
原声明的最简化版:
pFunParamy e;
理解复杂声明可用的“右左法则”:从变量名看起,先往右,再往左,碰到一个圆括号就调转阅读的方向;括号内分析完就跳出括号,还是按先右后左的顺序,如此循环,直到整个声明分析完。举例:
int (*func)(int *p);
首先找到变量名func,外面有一对圆括号,而且左边是一个号,这说明func是一个指针;然后跳出这个圆括号,先看右边,又遇到圆括号,这说明(func)是一个函数,所以func是一个指向这类函数的指针,即函数指针,这类函数具有int*类型的形参,返回值类型是int。
int (*func[5])(int *);
func右边是一个[]运算符,说明func是具有5个元素的数组;func的左边有一个,说明func的元素是指针(注意这里的不是修饰func,而是修饰func[5]的,原因是[]运算符优先级比高,func先跟[]结合)。跳出这个括号,看右边,又遇到圆括号,说明func数组的元素是函数类型的指针,它指向的函数具有int类型的形参,返回值类型为int。这种用法是比较复杂的,出现的频率也不少,往往在看到这样的用法却不能理解,相信以上的解释能有所帮助。
7.6.如果用calloc分配一个long型的数组,数组的初始值是否为0?如果用calloc分配一个指针数组,数组的初始值是否为空指针?
是的。
7.7.size命令的输出结果,为什么没有给出堆和栈的大小?
答案说的:只有通过exec
函数执行一个程序时,才会分配堆和堆栈。
7.10.我们不能将一个指针返回给一个自动变量,下面的程序是否正确?
int f1(int val){
int *ptr;
if(val == 0){
int val;
val = 5;
ptr = &val;
}
return (*ptr + 1);
}
这段代码肯定是不正确的,当if语句块结束后,局部变量val会被释放,指针将指向未被定义的空间,成为所谓的“悬空指针”。这样运行的话会提示Debug Error的。