学习笔记 9
第六章 信号和信号处理
6.1 信号和中断
“中断”:从I/O设备或协处理器发送到CPU的外部请求,将CPU从正常执行转移到中断处理。
“信号”:与发送到CPU的中断请求一样,“信号”是先发送给进程的请求,将进程从正常执行转移到中断处理。
“中断”是发送给“进程”的事件,它将“进程”从正常活动转移到其他活动,称为“中断处理”。“进程”可在完成“中断”处理后恢复正常活动。
“中断”的几种类型:
- 人员中断
- 进程中断
- 硬件中断
- 进程的陷阱错误
6.2 Unix/Linux信号示例
-
按“Ctrl+C”组合键通常会导致当前运行的进程终止。
-
用户可使用nohup a.out &命令在后台运行一个程序。即使在用户退出后,进程仍将继续运行。
-
用户再次登录时也许会发现(通过ps-u LTD)后台进程仍在运行。用户可以使用sh命令
kill pid (or kill -s 9 pid)
杀死该进程。
注:9号信号被保留为终止进程的终极手段
6.3 Unix/Linux中的信号处理
1.信号类型
Unix/Linux支持31种不同的信号,每种信号在signal.h文件中都有定义。
#define SIGHUP 1
#define SIGINT 2
#define SIGQUIT 3
#define SIGILL 4
#define SIGTRAP 5
#define SIGABRT 6
#define SIGIOT 6
#define SIGBUS 7
#define SIGFPE 8
#define SIGKILL 9 //进程终止
#define SIGUSR1 10
#define SIGSEGV 11
#define SIGUSR2 12
#define SIGPIPE 13
#define SIGALRM 14 //设置进程隔多久后会收到一个SIGALRM信号
#define SIGTERM 15
#define SIGSTKFLT 16
#define SIGCHLD 17
#define SIGCONT 18
#define SIGSTOP 19 //暂停进程的执行
#define SIGTSTP 20
#dpfine STGTTTN 21
#define SIGTTOU 22
#define SIGURG 23
#define SIGXCPU 24
#define SIGXFSZ 25
#define SIGVTALRM 26 //虚拟时钟信号。类似于 SIGALRM,计算的是该进程占用的CPU时间。
#define SIGPROF 27 //类似于SIGALRM/SIGVTALRM,但包括该进程用的 CPU 时间以及系统调用的时间。
#define SIGWINCH 28
#define SIGPOLL 29
#define SIGPWR 30
#define SIGSYS 31
2.信号的来源
来自硬件中断的信号
- 中断键(CtrI+C)
- 间隔定时器,当它的时间到期时,会生成一个SIGALRM( 14),SIGVTALRM(26)或SIGPROF (27)信号。
- 其他硬件错误,如总线错误、IO陷阱等。
来自异常的信号:当用户模式下的进程遇到异常时,会陷入内核模式,生成一个信号,并发送给自己。常见的陷阱信号有SIGFPE(8),表示浮点异常(除以0),最常见也是最可怕的是SIGSEGV(11),表示段错误,等等。
来自其他进程的信号:进程可使用kill(pid, sig)系统调用向pid标识的目标进程发送信号。读者可以尝试以下实验。在 Linux 下,运行简单的C程序
main(){ while(1); }
使进程无限循环。从另一个(X-window)终端,使用ps -u查找循环进程pid。然后输入sh命令
kill -s 11 pid
循环进程会因为段错误而死亡。当某进程被某个信号终止时,它的exitValue就包含这个信号编号。父进程sh只是将死亡子进程的信号编号转换为一个错误字符串。
3.进程PROC结构体中的信号
每个进程PROC都有一个32位向量,用来记录发送给进程的信号。
4.信号处理函数
每个进程PROC都有一个信号处理数组int sig[32]。sig[32]数组的每个条目都指定了如何处理相应的信号,其中0表示DEFault(默认),1表示 IGNore(忽略)。下图给出了信号位向量、屏蔽位向量和信号处理函数。
如果信号位向量中的位I为1,则会生成一个信号I或将其发送给进程。如果屏蔽位向量的位I为1,则信号会被阻塞 或屏蔽。否则,信号未被阻塞。只有当信号存在并且未被阻塞时,信号才会生效或传递给进程。
6.4 信号处理步骤
-
当某进程处于内核模式时,会检查信号并处理未完成的信号。如果某信号有用户安装的捕捉函数,该进程会先清除信号,获取捕捉函数地址,对于大多数陷阱信号,则将已安装的捕捉函数重置为DEFault。然后,它会在用户模式下返回,以执行捕捉函数,以这种方式篡改返回路径。当捕捉函数结束时,它会返回到最初的中断点,即它最后进入内核模式的地方。因此,该进程会先迁回执行捕捉函数,然后再恢复正常执行。
-
重置用户安装的信号捕捉函数:用户安装的陷阱相关信号捕捉函数用于处理用户代码中的陷阱错误。由于捕捉函数也在用户模式下执行,因此可能会再次出现同样的错误。如果是这样,该进程最终会陷入无限循环,一直在用户模式和内核模式之间跳跃。为了防止这种情况,Unix内核通常会在允许进程执行捕捉函数之前先将处理函数重置为 DEFault。这意味着用户安装的捕捉函数只对首次出现的信号有效。若要捕捉再次出现的同一信号,则必须重新安装捕捉函数。但是,用户安装的信号捕捉函数的处理方法并不都一样,在不同Unix版本中会有所不同。例如,在 BSD Unix中,信号处理函数不会被重置,但是该信号在执行信号捕捉函数时会被阻塞。
-
信号和唤醒:在Unix/Lintx内核中有两种SLEEP进程;深度休眠进程和浅度休眠进程。前一种进程不可中断,而后一种进程可由信号中断。如果某进程处于不可中断的SLEEP状态,到达的信号(必须来自硬件中断或其他进程)不会唤醒进程。如果它处于可中断的SLEEP状态,到达的信号将会唤醒它。例如,当某进程等待终端输入时,它会以低优先级休眠,这种休眠是可中断的,SIGINT这类信号即可唤醒它。
6.5 信号与异常
Unix信号最初设计用于以下用途。
-
作为进程异常的统一处理方法:当进程遇到异常时,它会陷人内核模式,将陷阱原因转换为信号编号,并将信号发送给自己。如果在内核模式下发生异常,内核只打印一条PANIC错误消息,然后就停止了。如果在用户模式下发生异常,则进程通常会终止,并以内存转储进行调试。
-
让进程通过预先安装的信号捕捉函数处理用户模式下的程序错误。这类似于MVS[IBM MVS]中的ESPIE宏。
-
在特殊情况下,它会让某个进程通过信号杀死另一个进程。注意,这里所说的杀死并不是直接杀死某个进程,而只是向目标进程发出“死亡”请求。
6.6 信号用作IPC
在一些地方,信号被归类为进程间的通信机制。基本原理是一个进程可以向另一个进程发送信号,使它执行预先安装的信号处理函数。由于以下原因,这种分类即使不算不恰当也颇具争议。
-
该机制并不可靠,因为可能会丢失信号。每个信号由位向量中的一个位表示,只能记录一个信号的一次出现。如果某个进程向另一个进程发送两个或多个相同的信号,它们可能只在接收PROC中出现一次。实时信号被放入队列,并保证按接收顺序发送,但操作系统内核可能不支持实时信号。
-
竞态条件:在处理信号之前,进程通常会将信号处理函数重置为DEFault。要想捕捉同一信号的再次出现,进程必须在该信号再次到来之前重新安装捕捉函数。否则,下一个信号可能会导致该进程终止。在执行信号捕捉函数时,虽然可以通过阻塞同一信号来防止竞态条件,但是无法防止丢失信号。
-
大多数信号都有预定义的含义。不加区别地任意使用信号不仅不能达到通信的目的,反而会造成混乱。
6.7 Linux中的IPC
IPC是指用于进程间通信的机制。在Linux中,IPC包含以下组成部分:
- 管道和FIFO:一个管道有一个读取端和一个写入端。管道的主要用途是连接一对管道写进程和读进程。管道写进程可将数据写入管道,读进程可从管道中读取数据。管道控制机制要对管道读写操作进行同步控制。未命名管道供相关进程 使用,命名管道是FIFO的,可供不相关进程使用。在Linux中的管道读取操作为同步和阻塞。如果管道仍有写进程但没有数据,读进程会进行等待。
- 信号:进程可使用kill系统调用向其他进程发送信号.其他进程使用信号捕捉函数处理信号,将信号用作IPC的一个主要缺点是信号只是用作通知,不含任何信息内容。
- System V IPC:包括共享内存、信号址和消息队列。在Linux中,多种 System V 1PC函数,例如用于添加/移除共享内存的shmat/shmdt、用于获取/操作信号反的semget/semop和用于发送/接收消息的msgsnd/msgrcv,都是库包装函数,它们都会向 Linux内核发出一个ipc()系统调用。ipc()的实现是Linux所特有的,不可移植。
- POSIX消息队列
- 线程同步机制:进程是共享某些公共资源的线程。如果是使用有共享地址空间的clone()系统调用创建的进程,它们可使用互斥量和条件变量通过共享内存进行同步通信。另外,常规进程可添加到共享内存,使它们可作为线程进行同步。
- 套接字:用于跨网络进程通信的IPC机制。
具体实践
示例6.1:sigaction的使用示例
代码:
#include <stdio.h>
#include <unistd.h>
#include <signal.h>
void handler(int sig, siginfo_t *siginfo, void *context)
{
printf("handler:sig=%d from PID=%d UID=%d\n",
sig, siginfo -> si_pid, siginfo -> si_uid);
}
int main(int argc, char *argv[])
{
struct sigaction act;
memset(&act, 0, sizeof(act));
act.sa_sigaction = &handler;
act.sa_flags = SA_SIGINFO;
sigaction(SIGTERM, &act, NULL);
printf("proc PID=%d looping\n");
printf("enter kill PID to send SIGTERM signal to it\n",getpid());
while(1){
sleep(10);
}
}
示例6.2:段错误捕捉函数
代码:
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <signal.h>
#include <setjmp.h>
#include <string.h>
jmp_buf env;
int count = 0;
void handler(int sig, siginfo_t *siginfo, void *context)
{
printf("handler: sig=%d from PID=%d UID=%d count=%d\n",
sig, siginfo->si_pid, siginfo->si_uid, ++count);
if (count >= 4) // let it occur up to 4 times
longjmp(env, 1234);
}
int BAD()
{
int *ip = 0;
printf("in BAD(): try to dereference NULL pointer\n");
*ip = 123; // dereference a NULL pointer
printf("should not see this line\n");
}
int main(int argc, char *argv[])
{
int r;
struct sigaction act;
memset(&act, 0, sizeof(act));
act.sa_sigaction = &handler;
act.sa_flags = SA_SIGINFO;
sigaction(SIGSEGV, &act, NULL);
if ((r = setjmp(env)) == 0)
BAD();
else
printf("proc %d survived SEGMENTATION FAULT: r=%d\n", getpid(), r);
printf("proc %d looping\n", getpid());
while (1)
;
}
问题与解决
1.SIGSTOP、SIGKILL为什么是不能捕捉的信号或忽略的信号?两者有什么区别?
不能被忽略的原因:他们向超级用户提供了使进程停止或终止的方法。
区别:一个为停止,一个为终止,前者表明程序还可以通过其他信号唤醒,后者表明程序已经退出,所有资源都被回收。