shell脚本执行超时怎么办?

在shell里会有一种不太常见的情况,就是脚本有时候会出现超时的现象。一般来说遇到这种问题,我们都会简单粗暴的采用下面这种脚本来当“超时看门狗“:

1
2
3
4
#!/bin/bash
./$1 &    #这里设定后台运行的第一个参数
pid = $!    #最后一个运行的process的PID值
sleep $2 && kill -9 $pid &    #如果超过了$2的值的话,就会把那个PID干掉


这个脚本搭配两个变量使用的话,监控一点小代码还算OK,但是它的逻辑还是比较粗糙,比如如果在这个脚本执行的时候,又有了一个新的process在后台启动,那么kill掉的就是新的process,而本应该停止的脚本还是在后台肆无忌惮的跑着。


为了不滥杀无辜,所以遇到这种情况,就要使用timeout命令,具体的用法请自行#man timeout,这个命令在centos 6里就是自带的。


假设我们要ping www.baidu.com ,同时要求“若超过了5秒没有反应,就停止这个任务”。那么就是用命令:#timeout 5s ping www.baidu.com,效果如图:

shell脚本执行超时怎么办?

从26秒到31秒,的确达到了5秒就跳出的效果。


牛刀小试结束,那么现在我们就来进化一下我们之前的那个MQ脚本,之前在 http://chenx1242.blog.51cto.com/10430133/1884415  里我曾经写过一个MQ脚本,但是那个MQ脚本有点理想化了,里面忘记了添加“超时监控”以及“重启失败的话会发邮件提醒运维人员”这两个功能,在这里我们就把上面两个短板补齐。


首先,我们先运行一下看看这个MQ看门狗脚本需要运行的时间:

shell脚本执行超时怎么办?


从上面可见整个脚本运行大约需要13秒,那么我们考虑到其他因素设定超时时间为20秒,执行效果如图:

shell脚本执行超时怎么办?


返回码是0,那么再看看如果因为超时而停止的返回码是多少呢?

shell脚本执行超时怎么办?


可见由于超时停止的返回码是124(ctrl+c手动退出的返回码是130),那么整个脚本就很好写了,如下:

1
2
3
4
5
6
7
8
9
#!/bin/bash
mailContent="检测RMSMQ脚本出现执行超时现象,请登录服务器上查看"
timeout 20s python checkRMSMQ.py
if [[ $? == 124 ]] ; then
        echo "看门狗没有在正常时间范围内执行完毕。"
        echo $mailContent | mail -s "RMSMQ看门狗脚本执行超时!"  邮箱地址@163.com
else
        echo "看门狗脚本在正常时间范围内执行完毕。"
fi


然后在crontab里直接执行这个脚本就好了。


补充说明之一,在文中测试timeout命令的时候,我使用了ping,其实这个是不严谨的,因为unix的ping默认会无限重复,所以#timeout 3s ping www.baidu.com  不管有没有网络连接都会超时。这里最好的例子是看看#timeout 3s sleep 1#timeout 3s sleep 5的区别。


补充说明之二,在shell脚本里,timeout后面若跟函数的话是无效的!




最后的最后,如果您觉得本文对您升职加薪有帮助,那么请不吝赞助之手,刷一下下面的二维码,赞助本人继续写更多的博文!

shell脚本执行超时怎么办?

 本文转自 苏幕遮618 51CTO博客,原文链接:http://blog.51cto.com/chenx1242/1950570



上一篇:C/C++内存存储的几个问题


下一篇:电子人火了!科技公司将芯片植入员工手掌