一、简介
MHA(Master HA)是一款开源的 MySQL 的高可用程序,它为 MySQL 主从复制架构提供了 automating master failover (自动化主故障转移)功能。MHA 在监控到 master 节点故障时,会提升其中拥有最新数据的 slave 节点成为新的master 节点,在此期间,MHA 会通过于其它从节点获取额外信息来避免一致性方面的问题。MHA 还提供了 master 节点的在线切换功能,即按需切换 master/slave 节点。
MHA 是由日本人 yoshinorim(原就职于DeNA现就职于FaceBook)开发的比较成熟的 MySQL 高可用方案。MHA 能够在30秒内实现故障切换,并能在故障切换中,最大可能的保证数据一致性。目前淘宝也正在开发相似产品 TMHA, 目前已支持一主一从。
二、MHA 服务
1、 服务角色
MHA 服务有两种角色, MHA Manager(管理节点)和 MHA Node(数据节点):
MHA Manager:
通常单独部署在一*立机器上管理多个 master/slave 集群(组),每个 master/slave 集群称作一个 application,用来管理统筹整个集群。
MHA node:
运行在每台 MySQL 服务器上(master/slave/manager),它**通过监控具备解析和清理 logs 功能的脚本来加快故障转移。
主要是接收管理节点所发出指令的代理,代理需要运行在每一个 mysql 节点上。简单讲 node 就是用来收集从节点服务器上所生成的 bin-log 。对比打算提升为新的主节点之上的从节点的是否拥有并完成操作,如果没有发给新主节点在本地应用后提升为主节点。
2、提供的工具
MHA会提供诸多工具程序, 其常见的如下所示:
Manager节点:
`masterha_check_ssh`:MHA 依赖的 ssh 环境监测工具;
`masterha_check_repl`:MYSQL 复制环境检测工具;
`masterga_manager`:MHA 服务主程序;
`masterha_check_status`:MHA 运行状态探测工具;
`masterha_master_monitor`:MYSQL master 节点可用性监测工具;
`masterha_master_swith:master`:节点切换工具;
`masterha_conf_host`:添加或删除配置的节点;
`masterha_stop`:关闭 MHA 服务的工具。
Node节点:(这些工具通常由MHA Manager的脚本触发,无需人为操作)
`save_binary_logs`:保存和复制 master 的二进制日志;
`apply_diff_relay_logs`:识别差异的中继日志事件并应用于其他 slave;
`purge_relay_logs`:清除中继日志(不会阻塞 SQL 线程);
自定义扩展:
`secondary_check_script`:通过多条网络路由检测master的可用性;
`master_ip_failover_script`:更新application使用的masterip;
`report_script`:发送报告;
`init_conf_load_script`:加载初始配置参数;
`master_ip_online_change_script`;更新master节点ip地址。
3、工作原理
MHA工作原理总结为以下几条:
(1) 从宕机崩溃的 master 保存二进制日志事件(binlog events);
(2) 识别含有最新更新的 slave ;
(3) 应用差异的中继日志(relay log) 到其他 slave ;
(4) 应用从 master 保存的二进制日志事件(binlog events);
(5) 提升一个 slave 为新 master ;
三、实现步骤
1、相关配置
MHA 对 MYSQL 复制环境有特殊要求,例如各节点都要开启二进制日志及中继日志,各从节点必须显示启用其`read-only`属性,并关闭`relay_log_purge`功能等,这里对配置做事先说明。
本实验环境共有四个节点, 其角色分配如下(实验机器均为centos 7):
机器名称 | IP | 角色 | 备注 |
manager | 192.168.11.11 | manager 控制器 | 用于监控管理 |
master | 192.168.11.12 | 数据库主服务器 | 开启bin-log relay-log 关闭relay-log-purge |
slave1 | 192.168.11.13 | 数据库从服务器 | 开启bin-log relay-log 关闭relay-log-purge |
slave2 | 192.168.11.14 | 数据库从服务器 | 开启bin-log relay-log 关闭relay-log-purge |
[root@node11 ~]# hostnamectl --static set-hostname manager
[root@manager ~]# systemctl status firewalld
[root@manager ~]# systemctl stop firewalld
[root@manager ~]# systemctl disable firewalld
[root@manager ~]# vim /etc/selinux/config
修改 SELINUX=disabled
[root@manager ~]# getenforce
[root@node12 ~]# hostnamectl --static set-hostname master
[root@master ~]# systemctl status firewalld
[root@master ~]# systemctl stop firewalld
[root@master ~]# systemctl disable firewalld
[root@master ~]# vim /etc/selinux/config
修改 SELINUX=disabled
[root@node13 ~]# hostnamectl --static set-hostname slave1
[root@slave1 ~]# systemctl status firewalld
[root@slave1 ~]# systemctl stop firewalld
[root@slave1 ~]# systemctl disable firewalld
[root@slave1~]# vim /etc/selinux/config
修改 SELINUX=disabled
[root@node14 ~]# hostnamectl --static set-hostname slave2
[root@slave2 ~]# systemctl status firewalld
[root@slave2 ~]# systemctl stop firewalld
[root@slave2 ~]# systemctl disable firewalld
[root@slave2 ~]# vim /etc/selinux/config
修改 SELINUX=disabled
为了方便我们后期的操作,我们在各节点的/etc/hosts文件配置内容中添加如下内容:
2、在master、slave1、slave2上都安装mariadb
(1)、安装
[root@master ~]# yum -y install mariadb-server mariadb-client
(2)、初始化mariadb
[root@master ~]# mysql_secure_installation
3、初始主节点master的配置
[root@master ~]# vim /etc/my.cnf/server.cnf
[mysqld]
server-id = 1 //复制集群中的各节点的id均必须唯一
log-bin = master-log //开启二进制日志
relay-log = relay-log //开启中继日志
skip_name_resolve //关闭名称解析(非必须)
[root@master ~]# systemctl restart mariadb
4、所有slave节点的配置
[root@slave1 ~]# vim /etc/my.cnf
[mysqld]
server-id = 2 //复制集群中的各节点的id均必须唯一;
relay-log = relay-log //开启中继日志
log-bin = master-log //开启二进制日志
read_only = ON //启用只读属性
relay_log_purge = 0 //是否自动清空不再需要中继日志
skip_name_resolve //关闭名称解析(非必须)
log_slave_updates = 1 //使得更新的数据写进二进制日志中
[root@slave1 ~]# systemctl restart mariadb
[root@slave2 ~]# vim /etc/my.cnf
[mysqld]
server-id = 3 //复制集群中的各节点的id均必须唯一;
relay-log = relay-log //开启中继日志
log-bin = master-log //开启二进制日志
read_only = ON //启用只读属性
relay_log_purge = 0 //是否自动清空不再需要中继日志
skip_name_resolve //关闭名称解析(非必须)
log_slave_updates = 1
[root@slave2 ~]# systemctl restart mariadb
5、配置一主多从复制架构
master节点上:
授权同步数据账号
[root@master ~]# mysql -uroot -p'keer'
MariaDB [(none)]>grant replication slave,replication client on *.* to 'slave'@'192.168.%.%' identified by 'keer';
备份数据导出到slave1、slave2从库
[root@master ~]# mysqldump -uroot -p'keer' --all-databases > `date +%F`-mysql-all.sql
[root@master ~]# scp *mysql-all.sql 192.168.11.13:/root
[root@master ~]# mysql -uroot -p'keer'
MariaDB [(none)]> show master status;
slave节点上:
导入数据
[root@slave1 ~]# mysql -uroot -p'keer' < *mysql-all.sql
[root@slave1 ~]# mysql -uroot -p'keer'
MariaDB [(none)]> change master to master_host='192.168.11.12',
-> master_user='slave',
-> master_password='keer',
-> master_log_file='mysql-bin.000001',
-> master_log_pos=415;
MariaDB [(none)]> start slave;
MariaDB [(none)]> show slave status\G;
6、在master上授权
在所有 Mysql 节点授权拥有管理权限的用户可在本地网络中有其他节点上远程访问。 当然, 此时仅需要且只能在 master 节点运行类似如下 SQL 语句即可。
[root@master ~]# mysql -uroot -p'keer'
MariaDB [(none)]> grant all on *.* to 'mhaadmin'@'192.168.%.%' identified by 'mhapass';
MariaDB [(none)]>\q
准备ssh多机通信
MHA集群中的各节点彼此之间均需要基于ssh互信通信,以实现远程控制及数据管理功能。简单起见,可在Manager节点生成密钥对儿,并设置其可远程连接本地主机后, 将私钥文件及authorized_keys文件复制给余下的所有节点即可。
[root@manager ~]# ssh-keygen -t rsa
[root@manager ~]# ssh-copy-id -i .ssh/id_rsa.pub 192.168.11.11
[root@manager ~]# cd .ssh/
[root@manager .ssh]# ls
authorized_keys id_rsa id_rsa.pub known_hosts
[root@manager .ssh]# cat authorized_keys
四台机器的公钥都已经在authorized_keys这个文件中了,接着,我们只需要把这个文件发送至另外三台机器,这四台机器就可以实现 ssh 无密码互通了:
[root@manager .ssh]# scp authorized_keys root@master:~/.ssh/
[root@manager .ssh]# scp authorized_keys root@slave1:~/.ssh/
[root@manager .ssh]# scp authorized_keys root@slave2:~/.ssh/
7、安装MHA