MHA manage 节点包含以下程序:
1. masterha_manager: 监控master, 以及执行failover机制
2. master_master_switch: 手动或者交互式的完成在线failover切换
3. master_check_status: 检查master_manager状态
4. master_check_repl:检查master复制环境是否正确
5. master_stop:关闭master manager
6. master_conf_host 用来在线修改master_manager配置
7. master_ssh_check: 检测SSH是否可以登录对应的Node节点
8. purge_relay_logs: 删除无用的relay log
9. master_secondary_check: 通过其他的路由去检测master是否真的挂了
二、masterha_check_status
MHA node节点包含四个程序:
1. save_binary_logs: 保存和复制宕机的master的二级制日志
2. apply_diff_relay_logs: 识别差异的relay log事件,并应用到其他的slave服务器
3. purge_relay_logs:清除relay log文件
介绍
检查 MHA manager的状态,MHA manager 提供了命令行的客户端"masterha_check_status"用来检查Manager 监控 主库的状态,
eg:
masterha_check_status --conf=/path/to/app.conf
app (pid:***) is running(0:PING_OK),master:***
状态列表
Status Code(Exit Code) Status String Description
0 PING OK 主库正在运行,MHA manager 监控中,Master的状态为alive
1 --- 未知的错误,例如:配置文件不存在
2 NOT_RUNNING MHA Manager 没有运行,Master 状态未知
3 PARTIALLY_RUNNING MHA Manager 主进程没有运行,但是子进程运行,这个不应该发生,必须检查,Master状态未知
10 INITIALIZING_MONITOR MHA Manager 刚刚启动,正在初始化,Master转态未知
20 PING_FAILING MHA Manager 检查到 ping Master发生错误,Master 状态 可能为DOWN
21 PING_FAILED MHA Manager 检查到 PING Master 发生三次错误或者准备执行master failover,Master状态可能为DONW
30 RETRYING_MONITOR MHA Manager 通过manager内部的健康检查程序发现Master不可达,但是在二次检查后发现Master状态为alive,并且等待重试.Master 状态可能为alive
31 CONFIG_ERROR 配置文件错误,MHA Manager 不能监控主库。详情查询logfile。Master状态未知
32 TIMESTAMP_OLD MHA Manager 发现PING Master OK,但是状态文件长时间为跟新,检查MHA Manager是否夯死,Master状态未知
50 FAILOVER_RUNNING MHA Manager 确认Master 宕机并开始执行failover.Master 状态为 dead
51 FAILOVER_ERROR MHA Manager 确认Master 宕机并开始执行failover,但是failover失败。Master 状态未知