转载自:https://www.jianshu.com/p/acd2ccb5ea8d
编写一个openwrt package程序,使用procd方式编写/etc/init.d/xxx 自启动脚本,就能拥有程序的监控,异常退出重新拉起功能
通常的嵌入式系统均有一个守护进程,该守护进程监控系统进程的状态,如果某些系统进程异常退出,将再次启动这些进程。procd 就是这样一个进程,它是使用C语言编写的,一个新的 OpenWrt 进程管理服务。它通过init脚本来将进程信息加入到 procd 的数据库中来管理进程启动,这是通过ubus总线调用来实现,可以防止进程的重复启动调用。
procd 的进程管理功能主要包含 3 个部分。
- reload_config,检查配置文件是否发生变化,如果有变化则通知 procd 进程。
- procd,守护进程,接收使用者的请求,增加或删除所管理的进程,并监控进程的状态,如果发现进程退出,则再次启动进程。
- procd.sh,提供函数封装procd提供系统总线方法,调用者可以非常便利的使用procd 提供的方法。
root@zihome:/etc/init.d# cat /var/run/config.md5
b9f0f9179b5b407ff85430da41877ba3 /var/run/config.check/dhcp
ce8e9fffa77a896c43cdeb2b83dede88 /var/run/config.check/dropbear
92a19521dd5c8cacd08e64e2785d94b1 /var/run/config.check/firewall
736bccfcc298fcdac1016da5f58518e1 /var/run/config.check/fstab
751c2e2ff80f2952b4c866fbc1d52f7d /var/run/config.check/guide
b9111c52e6db67b7bf550d5701a44e5f /var/run/config.check/htpdate
bad4e7384734245500ed9c081e0009f5 /var/run/config.check/igmpproxy
645f0a3cbfd1cf565b920dfd897af0c5 /var/run/config.check/network
3165f4af5f45e3209f9e20e28a78a76a /var/run/config.check/rpcd
87701d34b6de4ec46e6cb5edf1ac5f74 /var/run/config.check/system
6ec4ee52ca677ac87ff2469607a8cf9f /var/run/config.check/uhttpd
0ba26b28318a2a2d879fdad87f8e8c56 /var/run/config.check/upnpd
775e2ac3058da3ea2e973b3747233b92 /var/run/config.check/webpage
009ba5a3f9130b74662822d36d3ecd37 /var/run/config.check/wifidev
741a39d373e3c6f2dbeff47ca145606b /var/run/config.check/wireless
af357fab720926629ad9ab2ff4f465e1 /var/run/config.check/zihome
e2e3d1e8532386200a708f0c6837830c /var/run/config.check/zqos
如果在自己的启动脚本中定义了 USE_PROCD 那就调用这些函数。在 rc.common 中重
新定义了 start 函数,相当于重载了这些函数。
函 数 | 含 义 |
---|---|
start_service | 向 procd 注册并启动服务,是将在 services 所管理对象里面增加了一项 |
stop_service | 让 procd 解除注册,并关闭服务, 是将在 services 中的管理对象删除 |
service_triggers | 配置文件或网络接口改变之后触发服务重新读取配置 |
service_running | 查询服务的状态 |
reload_service | 重启服务,如果定义了该函数,在 reload 时将调用该函数,否则再次调用 start 函数 |
service_started | 用于判断进程是否启动成功 |
举例:
通常有两行内容是固定的,第一
行表示使用“/etc/rc.common”来解释脚本。
第二行内容设置 USE_PROCD 变量为 1,表示使
用 procd 来管理进程
(1)pprocd_open_instance 开始增加一个服务实例。
(2)procd_set_param 设置服务实例的参数值,通常会有以下几种类型的参数。
- command: 服务的启动命令行。
- respawn: 进程意外退出的重启机制及策略,它需要有 3 个设置值。第一个设置为判断异常失败边界值(threshold),默认为3600秒,如果小于这个时间退出,则会累加重新启动次数,如果大于这个临界值,则将重启次数置 0。第二个设置为重启延迟时间(timeout),将在多少秒后启动进程,默认为5秒。第三个设置是总的失败重启次数(retry),是进程永久退出之前的重新启动次数,超过这个次数进程退出之后将不会再启动。默认为 5 次。也可以不带任何设置,那这些设置都是默认值。
- env:进程的环境变量。
- file:配置文件名,比较其文件内容是否改变。
- netdev:绑定的网络设备(探测 ifindex 更改)。
- limits:进程资源限制。
每次只能使用一种类型参数,其后是这个类型参数的值。
(3)procd_close_instance 完成进程实例的增加。
vim /etc/init.d/zdetect
#!/bin/sh /etc/rc.common
USE_PROCD=1
START=88
STOP=92
start_service() {
procd_open_instance
procd_set_param command /usr/bin/zdetect
procd_set_param respawn
[ -e /proc/sys/kernel/core_pattern ] && {
procd_set_param limits core="unlimited"
}
procd_close_instance
}
vim /etc/init.d/zboard
#!/bin/sh /etc/rc.common
USE_PROCD=1
START=18
STOP=82
start_service() {
procd_open_instance
local wan_port=$(uci -q get zihome.system.wanport)
local wan_status=0
[ -z "$wan_port" ] && {
wan_port=0
}
if [ -f /tmp/status/wan_port_status ]; then
wan_status=$(cat /tmp/status/wan_port_status)
fi
procd_set_param command /usr/bin/zboard -p $wan_port -s $wan_status
procd_set_param respawn
[ -e /proc/sys/kernel/core_pattern ] && {
procd_set_param limits core="unlimited"
}
procd_close_instance
}
stop_service() {
local zboard_pid=""
zboard_pid=`ps -w | grep -w "/usr/bin/zboard" | grep -v grep| awk ‘{print $1}‘`
if [ "${zboard_pid}" != "" ];then
kill -9 ${zboard_pid}
fi
}
(4)procd_add_reload_trigger,增加配置文件触发器,每次配置文件的修改,如果调用了reload_config时,当前实例都被重启。有一个可选的参数为配置文件名称。其实它在内部是调用procd_open_trigger、procd_add_config_trigger和procd_close_trigger这3个函数来增加触发器。
(5)procd_open_validate,打开一个验证数组,是和 procd_close_validate 函数一起使用。
(6)procd_close_validate,关闭一个验证数组。示例 8-9 是软件包 firewall使用procd来对防火墙配置的触发器和验证。
(7)procd_open_service(name, [script]),至少需要一个参数,第一个参数是实例名称,第二个参数是可选参数为启动脚本。该函数仅在在rc.common 中调用,用于创建一个新的procd进程服务消息。
(8)procd_close_service,该函数不需要参数,仅在 rc.common 中调用,完成进程管理服务的增加。
(9)procd_kill,杀掉服务实例(或所有的服务实例)。至少需要一个参数,第一个参数是服务名称,通常为进程名,第二个是可选参数,是进程实例名称,因为可能有多个进程示例,如果不指定所有的实例将被关闭。该函数在 rc.common 中调用,用户从命令行调用 stop 函数时会使用该函数杀掉进程。
(10)uci_validate_section,调用 validate_data 命令注册为验证服务。在配置发生改变后对配置文件的配置项合法性进行校验。验证服务是在进程启动时通过 ubus 总线注册到procd进程中。输入以下命令,可以看到系统所有注册的验证服务。