接下来部署MHA,具体的搭建环境如下(所有操作系统均为CentOS7.4 64bit):
IP地址
主机名
角色
软件
192.168.12.106
Master.cn
manager
mha4mysql-manager、mha4mysql-node
192.168.12.108
Slave.cn
master
mha4mysql-node
192.168.12.109
Slave-2.cn
Slave1,Candicate master
mha4mysql-node
192.168.12.110
Slave-3.cn
Slave2
mha4mysql-node
其中master对外提供写服务,备选Candicate master(实际为slave1)提供读服务,slave2也提供读服务,一旦master宕机,将会把备选master提升为新的master,slave指向新的master
(1)在所有节点安装MHA node所需的perl模块(DBD:mysql),安装脚本如下:
先要安装epel源,
Centos6安装源:rpm -ivh http://dl.fedoraproject.org/pub/epel/6/x86_64/epel-release-6-8.noarch.rpm
Centos7安装源:rpm –ivh http://dl.fedoraproject.org/pub/epel/7/x86_64/e/epel-release-7-10.noarch.rpm
以下设置为CentOS6操作
[epel]
name=Extra Packages for Enterprise Linux 6 - $basearch
baseurl=http://download.fedoraproject.org/pub/epel/6/$basearch #将注释的#去掉
#mirrorlist=https://mirrors.fedoraproject.org/metalink?repo=epel-6&arch=$basearch#前面加上#
yum clean all
yum list
使用yum安装
全部依赖
yum -y install perl-DBD-MySQL perl-Config-Tiny perl-Log-Dispatch perl-Parallel-ForkManager --skip-broken
(2)上传MHA相关包,在所有的节点安装mha-node:
rpm -ivh mha4mysql-node-0.54-0.el6.noarch.rpm
安装完成后会在/usr/bin/目录下生成以下脚本文件:
[root@Master bin]# pwd
/usr/bin/
[root@Master bin]# ll app filter purge save
-r-xr-xr-x 1 root root 15498 Apr 20 10:05 apply_diff_relay_logs
-r-xr-xr-x 1 root root 4807 Apr 20 10:05 filter_mysqlbinlog
-r-xr-xr-x 1 root root 7401 Apr 20 10:05 purge_relay_logs
-r-xr-xr-x 1 root root 7263 Apr 20 10:05 save_binary_logs
2.安装MHA Manager
MHA Manager中主要包括了几个管理员的命令行工具,例如master_manger,master_master_switch等。MHA Manger也依赖于perl模块,具体如下:
(1)安装MHA Node软件包之前需要安装依赖。我这里使用yum完成,首先epel源要安装。注意:刚才我们已经配置epel源。
(2)安装MHA Manager。首先安装MHA Manger依赖的perl模块(我这里使用yum安装):
yum install perl-DBD-MySQL perl-Config-Tiny perl-Log-Dispatch perl-Parallel-ForkManager perl-Time-HiRes perl-ExtUtils-CBuilder perl-ExtUtils-MakeMaker perl-CPAN -y
安装MHA Manager软件包:
[root@Master ~]# rpm -ivh mha4mysql-manager-0.55-0.el6.noarch.rpm
安装完成后会在/usr/bin目录下面生成以下脚本文件
[root@Master ~]# ll /usr/bin/mast
-rwxr-xr-x 1 root root 1995 12月 13 2012 /usr/bin/masterha_check_repl
-rwxr-xr-x 1 root root 1779 12月 13 2012 /usr/bin/masterha_check_ssh
-rwxr-xr-x 1 root root 1865 12月 13 2012 /usr/bin/masterha_check_status
-rwxr-xr-x 1 root root 3201 12月 13 2012 /usr/bin/masterha_conf_host
-rwxr-xr-x 1 root root 2517 12月 13 2012 /usr/bin/masterha_manager
-rwxr-xr-x 1 root root 2165 12月 13 2012 /usr/bin/masterha_master_monitor
-rwxr-xr-x 1 root root 2373 12月 13 2012 /usr/bin/masterha_master_switch
-rwxr-xr-x 1 root root 3879 12月 13 2012 /usr/bin/masterha_secondary_check
-rwxr-xr-x 1 root root 1739 12月 13 2012 /usr/bin/masterha_stop
3.配置所有主机相互SSH登录无密码验证,不能禁止 password 登陆,否则会出现错误
ssh免密码登录
[root@Master ~]# ssh-keygen -t rsa
Generating public/private rsa key pair.
Enter file in which to save the key (/root/.ssh/id_rsa): 回车
Enter passphrase (empty for no passphrase): 回车
Enter same passphrase again: 回车
Your identification has been saved in /root/.ssh/id_rsa.
Your public key has been saved in /root/.ssh/id_rsa.pub.
The key fingerprint is:
e1:9f:7e:15:f1:de:07:d3:33:03:cc:3d:36:0c:96:26 root@Master.cn
The key‘s randomart image is:
+--[ RSA 2048]----+
| oo= |
| E..* |
| . o o+o|
| . . ++o|
| S ==|
| . . . +|
| o . .|
| . . |
| .. |
+-----------------+
[root@Master ~]# ssh-copy-id 192.168.12.108
[root@Master ~]# ssh-copy-id 192.168.12.109
[root@Master ~]# ssh-copy-id 192.168.12.110
其他主机重复上面操作。
4.搭建主从复制环境
注意:binlog-do-db 和 replicate-ignore-db 设置必须相同。 MHA 在启动时候会检测过滤规则,如果过滤规则不同,MHA 不启动监控和故障转移。
(1)在Slave配置主数据库服务器
创建需要同步的数据库:
mysql> create database HA;
mysql> use HA;
mysql> create table test(id int,name varchar(20));
service mysqld stop
配置my.cnf:
vim /etc/my.cnf
log-bin=mysql-bin-master #启用二进制日志
server-id=1 #本机数据库ID 标示
binlog-do-db=HA #可以被从服务器复制的库。二进制需要同步的数据库名
binlog-ignore-db=mysql #不可以被从服务器复制的库
validate-password=off
重启mysql:
systemctl restart mysqld
授权:
mysql> grant replication slave on . to repl@‘10.10.10.%‘ identified by ‘123456‘;
mysql> flush privileges;
查看状态信息:
mysql> show master status;
导出数据库到从服务器(2个从)
mysqldump -uroot -p123456 –B HA >HA.sql
scp HA.sql 10.10.10.65:/root
scp HA.sql 10.10.10.66:/root
(2)在Slave-2导入数据库并配置从服务:
[root@Slave-2 ~]# mysql -uroot -p123456 <HA.sql
配置my.cnf:
vim /etc/my.cnf
log-bin=mysql-slave1 #启用二进制日志
server-id=2 #本机数据库ID 标示
binlog-do-db=HA #可以被从服务器复制的库。二进制需要同步的数据库名
binlog-ignore-db=mysql #不可以被从服务器复制的库
log_slave_updates=1 #只有开启log_slave_updates,从库binlog才会记录主库同步的操作日志
validate-password=off
[root@Slave-2 ~]# systemctl restart mysqld 重启mysql
mysql> grant replication slave on . to ‘repl‘@‘10.10.10.%‘ identified by ‘123456‘;
mysql> flush privileges;
建立主从关系
mysql> stop slave;
mysql> change master to master_host=‘192.168.12.108‘,master_user=‘repl‘,master_password=‘123456‘;
(3)在Slave-3导入数据库并配置从服务:
[root@Slave-3 ~]# mysql -uroot -p123456 <HA.sql
配置my.cnf:
vim /etc/my.cnf
log-bin=mysql-slave2 #启用二进制日志
server-id=3 #本机数据库ID 标示
binlog-do-db=HA #可以被从服务器复制的库。二进制需要同步的数据库名
binlog-ignore-db=mysql #不可以被从服务器复制的库
log_slave_updates=1 #只有开启log_slave_updates,从库binlog才会记录主库同步的操作日志
validate-password=off
[root@Slave-3 ~]# systemctl restart mysqld 重启mysql
mysql> grant replication slave on . to ‘repl‘@‘10.10.10.%‘ identified by ‘123456‘;
mysql> flush privileges;
建立主从关系
mysql> stop slave;
mysql> change master to master_host=‘192.168.12.108‘,master_user=‘repl‘,master_password=‘123456‘;
(4)两台slave服务器设置read_only(从库对外提供读服务,只所以没有写进配置文件,是因为slave随时会提升为master)
[root@Slave-2~]# mysql -uroot -p123456 -e ‘set global read_only=1‘
[root@Slave-3 ~]# mysql -uroot -p123456 -e ‘set global read_only=1‘
(5)创建监控用户(在主从上都执行):
mysql> grant all privileges on . to ‘root‘@‘192.168.12.%‘ identified by ‘123456‘;
mysql> flush privileges;
到这里整个集群环境已经搭建完毕,剩下的就是配置MHA软件了。
5.配置MHA
(1)创建MHA的工作目录,并且创建相关配置文件(在软件包解压后的目录里面有样例配置文件)。
[root@ Master ~]# mkdir -p /etc/masterha
[root@ Master ~]# mkdir -p /var/log/masterha/app1
[root@ Master ~]# vim /etc/masterha/app1.cnf
修改app1.cnf配置文件,修改后的文件内容如下(注意,配置文件中的注释需要去掉,我这里是为了解释清楚):
[server default]
manager_workdir=/var/log/masterha/app1 //设置manager的工作目录
manager_log=/var/log/masterha/app1/manager.log //设置manager的日志
master_binlog_dir=/data/mysql //设置master 保存binlog的位置,以便MHA可以找到master的日志,我这里的也就是mysql的数据目录
master_ip_failover_script= /usr/local/bin/master_ip_failover //设置自动failover时候的切换脚本
master_ip_online_change_script= /usr/local/bin/master_ip_online_change //设置手动切换时候的切换脚本
password=123456 //设置mysql中root用户的密码,这个密码是前文中创建监控用户的那个密码
user=root 设置监控用户root
ping_interval=1 //设置监控主库,发送ping包的时间间隔,默认是3秒,尝试三次没有回应的时候自动进行railover
remote_workdir=/tmp //设置远端mysql在发生切换时binlog的保存位置
repl_password=123456 //设置复制用户的密码
repl_user=repl //设置复制环境中的复制用户名
report_script=/usr/local/send_report //设置发生切换后发送的报警的脚本
shutdown_script="" //设置故障发生后关闭故障主机脚本(该脚本的主要作用是关闭主机放在发生脑裂,这里没有使用)
ssh_user=root //设置ssh的登录用户名
[server1]
hostname=192.168.12.108
port=3306
[server2]
hostname=192.168.12.109
port=3306
candidate_master=1 #设置为候选master,如果设置该参数以后,发生主从切换以后将会将此从库提升为主库,即使这个主库不是集群中事件最新的slave
check_repl_delay=0 #默认情况下如果一个slave落后master 100M的relay logs的话,MHA将不会选择该slave作为一个新的master,因为对于这个slave的恢复需要花费很长时间,通过设置check_repl_delay=0,MHA触发切换在选择一个新的master的时候将会忽略复制延时,这个参数对于设置了candidate_master=1的主机非常有用,因为这个候选主在切换的过程中一定是新的master
[server3]
hostname=192.168.12.110
port=3306
(2)设置relay log的清除方式(在每个slave节点上):
[root@Slave-2 ~]# mysql -uroot -p123456 -e ‘set global relay_log_purge=0‘
[root@Slave-3 ~]# mysql -uroot -p123456 -e ‘set global relay_log_purge=0‘
注意:
MHA在发生切换的过程中,从库的恢复过程中依赖于relay log的相关信息,所以这里要将relay log的自动清除设置为OFF,采用手动清除relay log的方式。在默认情况下,从服务器上的中继日志会在SQL线程执行完毕后被自动删除。但是在MHA环境中,这些中继日志在恢复其他从服务器时可能会被用到,因此需要禁用中继日志的自动删除功能。定期清除中继日志需要考虑到复制延时的问题。在ext3的文件系统下,删除大的文件需要一定的时间,会导致严重的复制延时。为了避免复制延时,需要暂时为中继日志创建硬链接,因为在Linux系统中通过硬链接删除大文件速度会很快。(在mysql数据库中,删除大表时,通常也采用建立硬链接的方式)
(3).检查SSH配置
检查MHA Manger到所有MHA Node的SSH连接状态:
[root@Master~]# masterha_check_ssh --conf=/etc/masterha/app1.cnf
可以看见各个节点ssh验证都是ok的。
(4).检查整个复制环境状况。
通过masterha_check_repl脚本查看整个集群的状态
[root@ Master ~]# masterha_check_repl --conf=/etc/masterha/app1.cnf
MySQL Replication Health is NOT OK! 如果提示这个不ok,说明有问题
MySQL Replication Health is OK. 显示Ok ,正常!
(5).检查MHA Manager的状态:
通过master_check_status脚本查看Manager的状态:
[root@Master ~]# masterha_check_status --conf=/etc/masterha/app1.cnf
app1 is stopped(2:NOT_RUNNING).
注意:如果正常,会显示"PING_OK",否则会显示"NOT_RUNNING",这代表MHA监控没有开启。
(6).开启MHA Manager监控
[root@ Master ~]# nohup masterha_manager --conf=/etc/masterha/app1.cnf --remove_dead_master_conf --ignore_last_failover < /dev/null > /var/log/masterha/app1/manager.log 2>&1 &
[1] 30867
启动参数介绍:
--remove_dead_master_conf 该参数代表当发生主从切换后,老的主库的ip将会从配置文件中移除。
--manger_log 日志存放位置
--ignore_last_failover 在缺省情况下,如果MHA检测到连续发生宕机,且两次宕机间隔不足8小时的话,则不会进行Failover,之所以这样限制是为了避免ping-pong效应。该参数代表忽略上次MHA触发切换产生的文件,默认情况下,MHA发生切换后会在日志目录,也就是上面我设置的/data产生app1.failover.complete文件,下次再次切换的时候如果发现该目录下存在该文件将不允许触发切换,除非在第一次切换后收到删除该文件,为了方便,这里设置为--ignore_last_failover。
查看MHA Manager监控是否正常:
[root@ Master ~]# masterha_check_status --conf=/etc/masterha/app1.cnf
app1 (pid:20386) is running(0:PING_OK), master:192.168.12.109
可以看见已经在监控了,而且master的主机为192.168.12.109
(7).查看启动日志
复制代码
[root@Master ~]# tail -n20 /var/log/masterha/app1/manager.log
………………..
…………………
Sun Apr 20 19:12:01 2014 - [info] Ping(SELECT) succeeded, waiting until MySQL doesn‘t respond..
其中"Ping(SELECT) succeeded, waiting until MySQL doesn‘t respond.."说明整个系统已经开始监控了。
(8).关闭MHA Manage监控
关闭很简单,使用masterha_stop命令完成。
[root@Master~]# masterha_stop --conf=/etc/masterha/app1.conf
Stopped app1 successfully.
[1]+ Exit 1 nohup masterha_manager --conf=/etc/masterha/app1.cnf --remove_dead_master_conf --ignore_last_failover --manager_log=/data/mamanager.log