Linux 程序卡死的特殊处理

一、前言

Linux环境。

我们在日常编写的程序中,可能会出现一些细节问题,导致程序卡死,即程序没法正常运行,界面卡住,也不会闪退...

当这种问题出现在客户现场,那就是大问题了。。。

当我们暂时还无法排查出问题时,可以使用一些特殊手段进行监控,当发现程序卡死的时候,就可以将程序杀死掉。然后再将程序启动起来。

二、程序内部操作

首先在我们的程序代码中,增加QTimer超时或者线程去执行,每两秒钟执行命令:touch appclear.txt  ,去修改文件的最近修改时间

这样做的处理是,只要主程序还没有卡死,那么appclear.txt文件就会每两秒钟都会被修改,剩下我们只需要在外部启动一个脚本用于监测该文件的修改时间,如果大于某个时间段没有修改操作了,那么就说明程序卡死了,就需要立即杀死程序。

1.QT

QTimer m_touch_timer;

// 每2s改一下文件的修改该时间,使得脚本可以监控程序有没有死掉
connect(&m_touch_timer, &QTimer::timeout, [this]() {
    QProcess::startDetached("touch", QStringList() << "appclear.txt");
});
m_touch_timer.setInterval(2000);
m_touch_timer.start();

2.C/C++

#include <iostream>  
#include <thread>  
#include <chrono>  
#include <cstdlib> // 对于system函数  
  
// 定义一个函数,该函数将作为线程的执行体  
void periodicTouch() {  
    while (true) {  
        // 执行touch命令  
        system("touch appclear.txt");  
  
        // 等待两秒钟  
        std::this_thread::sleep_for(std::chrono::seconds(2));  
    }  
}  
  
int main() {  
    // 创建一个线程来运行periodicTouch函数  
    std::thread touchThread(periodicTouch);  

  
    touchThread.join();  
    return 0;  
}

三、外部监控脚本

此脚本会每两秒钟监控一次appclear.txt文件的最近修改时间,如果当前时间与文件的最近修改时间做差值 大于 10,那么就说明程序已经卡死10秒钟了,可以杀死程序。(假设程序名为HelloWorld)

#!/bin/bash

DATE_N_=`date "+%Y-%m-%d"`
LOG_PATH_NAME="/home/Jtom/log/${DATE_N_}_appclear_sh.log"

log_info()
{
    DATE_N=`date "+%Y-%m-%d %H:%M:%S"`
    echo "${DATE_N} $0 [INFO] $@" >> ${LOG_PATH_NAME}
}

sleep 5

log_info "start"

while true ;do
	timestamp=`date +%s`
	filepath=/home/Jtom/appclear.txt


	if [ -f $filepath ];
	then
		filetimestamp=`stat -c %Y $filepath`
		timecha=$[$timestamp - $filetimestamp]

		if [ $timecha -gt 10 ];then
			log_info '强制退出程序'
			killall -9 HelloWorld	# HelloWorld 你的程序名字
			rm -f $filepath
			sleep 10
		else
			sleep 2
		fi

	else
		log_info "文件不存在或者您输入的路径有误"
		sleep 5
	fi
done


log_info "end"

四、再重新启动程序

程序被杀死后肯定需要自动再起来,那么我们还需要另一个脚本进行监控,如果程序没有被运行,则立即起来。

可以查看我之前的另一篇文章。

Linxu 守护程序https://blog.****.net/cpp_learner/article/details/139475547?spm=1001.2014.3001.5502

五、总结

这样操作下来,就可以避免程序卡死的尴尬情况。

当然,这只是一种临时处理方式,肯定不能长期使用,最终还是得排查程序找出问题,为什么卡死,这才是程序员该做的事情!

上一篇:C++学习笔记-C语言与C++语言的区别


下一篇:使用Python绘制甘特图