Redis主备自动切换

Sentinel(哨兵)是用于监控redis集群中Master状态的工具.

一、Sentinel作用
  1、Master状态检测 
  2、如果Master异常,则会进行Master-Slave切换,将其中一个Slave作为Master,将之前的Master作为Slave;
  3、Master-Slave切换后,master_redis.conf、slave_redis.conf和sentinel.conf的内容都会发生改变,即master_redis.conf中会多一行slaveof的配置,sentinel.conf的监控目标会随之调换;

二、Sentinel工作方式 

1、每个Sentinel以每秒钟一次的频率向它所知的Master,Slave以及其他 Sentinel 实例发送一个 PING 命令
  2、如果一个实例(instance)距离最后一次有效回复 PING 命令的时间超过 down-after-milliseconds 选项所指定的值, 则这个实例会被 Sentinel 标记为主观下线。
  3、如果一个Master被标记为主观下线,则正在监视这个Master的所有 Sentinel 要以每秒一次的频率确认Master的确进入了主观下线状态。
  4、当有足够数量的 Sentinel(大于等于配置文件指定的值)在指定的时间范围内确认Master的确进入了主观下线状态, 则Master会被标记为客观下线
  5、在一般情况下, 每个 Sentinel 会以每 10 秒一次的频率向它已知的所有Master,Slave发送 INFO 命令
  6、当Master被 Sentinel 标记为客观下线时,Sentinel 向下线的 Master 的所有 Slave 发送 INFO 命令的频率会从 10 秒一次改为每秒一次
  7、若没有足够数量的 Sentinel 同意 Master 已经下线, Master 的客观下线状态就会被移除。 若 Master 重新向 Sentinel 的 PING 命令返回有效回复, Master 的主观下线状态就会被移除。

主观下线和客观下线
   主观下线:Subjectively Down,简称 SDOWN,指的是当前 Sentinel 实例对某个redis服务器做出的下线判断;
   客观下线:Objectively Down, 简称 ODOWN,指的是多个 Sentinel 实例在对Master Server做出 SDOWN 判断,并且通过 SENTINEL is-master-down-by-addr 命令互相交流之后,得出的Master Server下线判断,然后开启failover.
   SDOWN适合于Master和Slave,只要一个 Sentinel 发现Master进入了ODOWN, 这个 Sentinel 就可能会被其他 Sentinel 推选出, 并对下线的主服务器执行自动故障迁移操作。
  ODOWN只适用于Master,对于Slave的 Redis 实例,Sentinel 在将它们判断为下线前不需要进行协商, 所以Slave的 Sentinel 永远不会达到ODOWN。

三、Sentinel配置实现主备自动切换

Sentinel中只需要在各节点(包括Master节点)中配置sentinel monitor为master的信息即可,不需要再配置slave的信息。在每一个redis节点中的Sentinel.conf文件中。

slave的sentinel.conf配置:

port 26379

#master2

sentinel monitor master2 192.168.15.129 6379 1  ---master地址 名字为哨名的名字,不同服务器上可以取得不一样

sentinel down-after-milliseconds master2 5000

sentinel failover-timeout master2 900000

#sentinel can-failover master2 yes

sentinel parallel-syncs master2 2

Master机器上sentinel.conf配置

属性

描述

port

16379

监视哨端口

daemonize

yes

启动的进程为后台进程

logfile

“/opt/oracle/redis-2.8.19/logs/sentinel.log”

日志文件

sentinel monitor <master-name>   <ip> <redis-port> <quorum>

sentinel monitor mymaster 127.0.0.1   6379 1

IP和端口为Master的IP地址和端口,mymaster为集群名称,可以修改为想要的名称,客户端访问时需要这个名称

sentinel down-after-milliseconds   <master-name> 30000

sentinel down-after-milliseconds mymaster 30000

master-name为一个统一的集群名称

sentinel failover-timeout   <master-name> 180000

sentinel failover-timeout mymaster 180000

sentinel parallel-syncs   <master-name> <numslaves>

sentinel parallel-syncs mymaster 1

 

Slave机器上sentinel配置

 slave上的sentinel配置与Master上的配置相同,只需要将master-name修改即可

启动顺序如下:

1、redis-server redis.conf 启动Master主机;

2、redis-server redis.conf 启动Slave主机 ;

3、redis-sentinel sentinel.conf 启动Master主机上的监视哨;

4、redis-sentinel sentinel.conf 启动Slave主机上的监视哨

注意:首次启动时,必须先启动Master
        若Master已经被判定为下线,Sentinel已经选择了新的Master,也已经将old Master改成Slave,但是还没有将其改成new Master。若此时重启old Master,则Redis集群将处于无Master状态,此时只能手动修改配置文件,然后重新启动集群

四、示例如下:
master:192.168.15.129,

slave  :192.168.15.128

master的配置文件正常,slave的配置文件添加一行:
slaveof 192.168.15.129 6379
 
master的sentinel.conf配置(此处我的文件名称为sentinel-test.conf):
port 26379
#master1
sentinel monitor master1 192.168.15.129 6379 1
sentinel down-after-milliseconds master1 5000
sentinel failover-timeout master1 900000
#sentinel can-failover master1 yes
sentinel parallel-syncs master1 2
 
slave的sentinel.conf配置(此处我的文件名称为sentinel-test.conf):
port 26379
#master2
sentinel monitor master2 192.168.15.129 6379 1
sentinel down-after-milliseconds master2 5000
sentinel failover-timeout master2 900000
#sentinel can-failover master2 yes
sentinel parallel-syncs master2 2

分别启动master和slave的redis服务和sentinel服务

[root@localhostsrc]#./redis-server../redis.conf

[root@localhostsrc]#./redis-sentinel../sentinel-test.conf

然后根据以下场景切换主备,切换成功,当测试都通过时,才算是配置完成

测试主备切换场景:

主:129,备:128,sen:128,129

关闭129的redis和sen,看是否能够切换到128上面,在128上面删除数据,启动129的redis和sen,看是否数据会同步,再关闭128的redis和sen,看是否会切换为129

运行如下命令,连接客户端查看Slave状态:./redis-cli -h IP -p Port

Redis主备自动切换

上一篇:Android开发人员不得不收集的代码(转)


下一篇:存储那些事儿(五):BTRFS文件系统之Btree结构详解