问题描述
当SSH远程连接到服务器上,然后运行一个服务,再把终端开闭(切断SSH连接)之后,发现该服务中断,导致系统不可用。
解决方法
使用 nohup
命令让进程在关闭窗口(切换SSH连接)的时候进程还能继续在后台运行。
nohup命令说明
- 用途:不挂断地运行命令。
- 语法:nohup Command [ Arg … ] [ & ]
- 描述:nohup 命令运行由 Command 参数和任何相关的 Arg 参数指定的命令,忽略所有挂断(SIGHUP)信号。在注销后使用 nohup 命令运行后台中的进程。要运行后台中的 nohup 命令,添加 & ( 表示“and”的符号)到命令的尾部。
无论是否将 nohup 命令的输出重定向到终端,输出都将附加到当前目录的 nohup.out 文档中。如果当前目录的 nohup.out 文档不可写,输出重定向到 $HOME/nohup.out 文档中。如果没有文档能创建或打开以用于追加,那么 Command 参数指定的命令不可调用。如果标准错误是一个终端,那么把指定的命令写给标准错误的所有输出作为标准输出重定向到相同的文档描述符。
深入探讨
为什么ssh一关闭,进程就不再运行了?
元凶:SIGHUP 信号。让我们来看看为什么关掉窗口/断开连接会使得正在运行的进程死掉。
在Linux/Unix中,有这样几个概念:
- 进程组(process group):一个或多个进程的集合,每一个进程组有唯一一个进程组ID,即进程组长进程的ID。
- 会话期(session):一个或多个进程组的集合,有唯一一个会话期首进程(session leader)。会话期ID为首进程的ID。
会话期可以有一个单独的控制终端(controlling terminal)。与控制终端连接的会话期首进程叫做控制进程(controlling process)。当前与终端交互的进程称为前台进程组。其余进程组称为后台进程组。
根据POSIX.1定义:挂断信号(SIGHUP)默认的动作是终止进程。
当终端接口检测到网络连接断开,将挂断信号发送给控制进程(会话期首进程)。如果会话期首进程终止,则该信号发送到该会话期前台进程组。一个进程退出导致一个孤儿进程组中产生时,如果任意一个孤儿进程组进程处于STOP状态,发送SIGHUP和SIGCONT信号到该进程组中所有进程。(关于孤儿进程参照:http://blog.csdn.net/hmsiwtv/article/details/7901711 )
结论
:因此当网络断开或终端窗口关闭后,也就是SSH断开以后,控制进程收到SIGHUP信号退出,会导致该会话期内其他进程退出。
简而言之:就是ssh 打开以后,bash等都是他的子进程,一旦ssh关闭,系统将所有相关进程杀掉!! 导致一旦ssh关闭,执行中的任务就取消了
例子
我们来看一个例子。打开两个SSH终端窗口,在其中一个运行top命令。
1
[root@tivf09 root]# top
在另一个终端窗口,找到top的进程ID为5180,其父进程ID为5128,即登录shell。
1 |
[root@tivf09 root]# ps -ef|grep top |
使用pstree命令可以更清楚地看到这个关系:
1 |
[root@tivf09 root]# pstree -H 5180|grep top |
使用ps-xj命令可以看到,登录shell(PID 5128)和top在同一个会话期,shell为会话期首进程,所在进程组PGID为5128,top所在进程组PGID为5180,为前台进程组。
1 |
[root@tivf09 root]# ps -xj|grep 5128 |
关闭第一个SSH窗口,在另一个窗口中可以看到top也被杀掉了。
1 |
[root@tivf09 root]# ps -ef|grep 5128 |
使用后台运行命令&, 能否将进程摆脱ssh进程组控制?
也就是问如果ssh关闭,后台进程是否继续运行?
我们做一个试验: find / -name ‘*http*’&
, 利用ctrl+d 注销以后 再进入系统 会不会看见这个命令再运行?
答案是: 命令被中止了! 因为他依然属于这个ssh进程组, 就算加了&也无法摆脱!
1 |
[root@CentOS5-4 ~]# pstree |grep find |
为什么守护进程就算用 ssh 打开,而关闭ssh也不会影响其运行?
因为他们的进程特殊,比如 httpd –k start
运行这个以后,他不属于sshd这个进程组, 而是单独的进程组, 所以就算关闭了ssh,和他也没有任何关系!
1 |
[root@CentOS5-4 ~]# pstree |grep http |
结论
:守护进程的启动命令本身就是特殊的,和一般命令不同的,比如mysqld_safe 这样的命令 一旦使用了 就是守护进程运行。所以想把一般进程改造为守护进程是不可能,
nohup能解决的问题
为了能够再注销以后依然能后台运行,那么我们就可以使用nohup这个命令。
我们现在开始查找 find / -name ‘*http*’&
,并且希望在后台运行,那么就使用
1
nohup:nohup find / -name "*httpd*"
此时默认地进程运行的输出信息放到当前文档夹的nohup.out 文档中去, 加不加&并不会影响这个命令, 只是让进程前台或者后台运行而已。
延伸:Linux命令nohup+screen命令
如果想在关闭ssh连接后刚才启动的进程继续运行怎么办,可以使用nohup。但是如果要求第二天来的时候,一开ssh,还能查看到昨天运行的进程的状态,然后继续工作,这时nohup是不行了,需要使用 screen
来达到这个目的。
虽然nohup很容易使用,但还是比较“简陋”的,对于简单的命令能够应付过来,对于复杂的需要人机交互的任务就麻烦了。其实我们可以使用一个更为强大的实用进程screen。
参考资料
>