openwrt监控程序(守护进程)

转载自:https://www.jianshu.com/p/acd2ccb5ea8d

 

编写一个openwrt package程序,使用procd方式编写/etc/init.d/xxx 自启动脚本,就能拥有程序的监控,异常退出重新拉起功能 

 

 

通常的嵌入式系统均有一个守护进程,该守护进程监控系统进程的状态,如果某些系统进程异常退出,将再次启动这些进程。procd 就是这样一个进程,它是使用C语言编写的,一个新的 OpenWrt 进程管理服务。它通过init脚本来将进程信息加入到 procd 的数据库中来管理进程启动,这是通过ubus总线调用来实现,可以防止进程的重复启动调用。

procd 的进程管理功能主要包含 3 个部分。

  • reload_config,检查配置文件是否发生变化,如果有变化则通知 procd 进程。
  • procd,守护进程,接收使用者的请求,增加或删除所管理的进程,并监控进程的状态,如果发现进程退出,则再次启动进程。
  • procd.sh,提供函数封装procd提供系统总线方法,调用者可以非常便利的使用procd 提供的方法。
root@zihome:/etc/init.d# cat /var/run/config.md5 
b9f0f9179b5b407ff85430da41877ba3  /var/run/config.check/dhcp
ce8e9fffa77a896c43cdeb2b83dede88  /var/run/config.check/dropbear
92a19521dd5c8cacd08e64e2785d94b1  /var/run/config.check/firewall
736bccfcc298fcdac1016da5f58518e1  /var/run/config.check/fstab
751c2e2ff80f2952b4c866fbc1d52f7d  /var/run/config.check/guide
b9111c52e6db67b7bf550d5701a44e5f  /var/run/config.check/htpdate
bad4e7384734245500ed9c081e0009f5  /var/run/config.check/igmpproxy
645f0a3cbfd1cf565b920dfd897af0c5  /var/run/config.check/network
3165f4af5f45e3209f9e20e28a78a76a  /var/run/config.check/rpcd
87701d34b6de4ec46e6cb5edf1ac5f74  /var/run/config.check/system
6ec4ee52ca677ac87ff2469607a8cf9f  /var/run/config.check/uhttpd
0ba26b28318a2a2d879fdad87f8e8c56  /var/run/config.check/upnpd
775e2ac3058da3ea2e973b3747233b92  /var/run/config.check/webpage
009ba5a3f9130b74662822d36d3ecd37  /var/run/config.check/wifidev
741a39d373e3c6f2dbeff47ca145606b  /var/run/config.check/wireless
af357fab720926629ad9ab2ff4f465e1  /var/run/config.check/zihome
e2e3d1e8532386200a708f0c6837830c  /var/run/config.check/zqos

如果在自己的启动脚本中定义了 USE_PROCD 那就调用这些函数。在 rc.common 中重
新定义了 start 函数,相当于重载了这些函数。

函 数 含 义
start_service 向 procd 注册并启动服务,是将在 services 所管理对象里面增加了一项
stop_service 让 procd 解除注册,并关闭服务, 是将在 services 中的管理对象删除
service_triggers 配置文件或网络接口改变之后触发服务重新读取配置
service_running 查询服务的状态
reload_service 重启服务,如果定义了该函数,在 reload 时将调用该函数,否则再次调用 start 函数
service_started 用于判断进程是否启动成功

举例:

通常有两行内容是固定的,第一
行表示使用“/etc/rc.common”来解释脚本。
第二行内容设置 USE_PROCD 变量为 1,表示使
用 procd 来管理进程

(1)pprocd_open_instance 开始增加一个服务实例。

(2)procd_set_param 设置服务实例的参数值,通常会有以下几种类型的参数。

  • command: 服务的启动命令行。
  • respawn: 进程意外退出的重启机制及策略,它需要有 3 个设置值。第一个设置为判断异常失败边界值(threshold),默认为3600秒,如果小于这个时间退出,则会累加重新启动次数,如果大于这个临界值,则将重启次数置 0。第二个设置为重启延迟时间(timeout),将在多少秒后启动进程,默认为5秒。第三个设置是总的失败重启次数(retry),是进程永久退出之前的重新启动次数,超过这个次数进程退出之后将不会再启动。默认为 5 次。也可以不带任何设置,那这些设置都是默认值。
  • env:进程的环境变量。
  • file:配置文件名,比较其文件内容是否改变。
  • netdev:绑定的网络设备(探测 ifindex 更改)。
  • limits:进程资源限制。
    每次只能使用一种类型参数,其后是这个类型参数的值。

(3)procd_close_instance 完成进程实例的增加。

vim /etc/init.d/zdetect

#!/bin/sh /etc/rc.common
USE_PROCD=1

START=88
STOP=92

start_service() {
        procd_open_instance
        procd_set_param command /usr/bin/zdetect
        procd_set_param respawn
        [ -e /proc/sys/kernel/core_pattern ] && {
                procd_set_param limits core="unlimited"
        }

        procd_close_instance
}

vim /etc/init.d/zboard

#!/bin/sh /etc/rc.common
USE_PROCD=1

START=18
STOP=82

start_service() {
        procd_open_instance
        local wan_port=$(uci -q get zihome.system.wanport)
        local wan_status=0

        [ -z "$wan_port" ] && {
                wan_port=0
        }

        if [ -f /tmp/status/wan_port_status ]; then
                wan_status=$(cat /tmp/status/wan_port_status)
        fi

        procd_set_param command /usr/bin/zboard -p $wan_port -s $wan_status
        procd_set_param respawn
        [ -e /proc/sys/kernel/core_pattern ] && {
                procd_set_param limits core="unlimited"
        }
        procd_close_instance
}

stop_service() {
        local zboard_pid=""

        zboard_pid=`ps -w | grep -w "/usr/bin/zboard" | grep -v grep| awk ‘{print $1}‘`

        if [ "${zboard_pid}" != "" ];then
                kill -9 ${zboard_pid}
        fi

}

(4)procd_add_reload_trigger,增加配置文件触发器,每次配置文件的修改,如果调用了reload_config时,当前实例都被重启。有一个可选的参数为配置文件名称。其实它在内部是调用procd_open_trigger、procd_add_config_trigger和procd_close_trigger这3个函数来增加触发器。

(5)procd_open_validate,打开一个验证数组,是和 procd_close_validate 函数一起使用。

(6)procd_close_validate,关闭一个验证数组。示例 8-9 是软件包 firewall使用procd来对防火墙配置的触发器和验证。

(7)procd_open_service(name, [script]),至少需要一个参数,第一个参数是实例名称,第二个参数是可选参数为启动脚本。该函数仅在在rc.common 中调用,用于创建一个新的procd进程服务消息。

(8)procd_close_service,该函数不需要参数,仅在 rc.common 中调用,完成进程管理服务的增加。

(9)procd_kill,杀掉服务实例(或所有的服务实例)。至少需要一个参数,第一个参数是服务名称,通常为进程名,第二个是可选参数,是进程实例名称,因为可能有多个进程示例,如果不指定所有的实例将被关闭。该函数在 rc.common 中调用,用户从命令行调用 stop 函数时会使用该函数杀掉进程。

(10)uci_validate_section,调用 validate_data 命令注册为验证服务。在配置发生改变后对配置文件的配置项合法性进行校验。验证服务是在进程启动时通过 ubus 总线注册到procd进程中。输入以下命令,可以看到系统所有注册的验证服务。

openwrt监控程序(守护进程)

上一篇:Linux 下判断磁盘是ssd还是hdd


下一篇:linux系统设置中文字体