目录
引言
Redis群集有三种模式,分别是主从同步/复制、哨兵模式、Cluster,下面会讲解一下三种模式的工作方式,以及如何搭建Cluster群集。
一、Redis主从复制
1、Redis主从复制的概念
(1)主从复制,是指将一台Redis服务器的数据,复制到其他的Redis服务器
前者称为主节点(Master),后者称为从节点(Slave);数据的复制是单向的,只能由主节点到从节点。
(2)默认情况下,每台Redis服务器都是主节点
一个主节点可以有多个从节点(或没有从节点),但一个从节点只能有一个主节点。
2、Redis主从复制的作用
(1)数据冗余:主从复制实现了数据的热备份,是持久化之外的一种数据冗余方式。
(2)故障恢复:当主节点出现问题时,可以由从节点提供服务,实现快速的故障恢复;实际上是一种服务的冗余。
(3)负载均衡:在主从复制的基础上,配合读写分离,可以由主节点提供写服务,由从节点提供读服务(即写Redis数据时应用连接主节点,读Redis数据时应用连接从节点),分担服务器负载;尤其是在写少读多的场景下,通过多个从节点分担读负载,可以大大提高Redis服务器的并发量。
(4)高可用基石:除了上述作用以外,主从复制还是哨兵和集群能够实施的基础,因此说主从复制是Redis高可用的基础。
3、Redis主从复制的流程
第一步:若启动一个Slave机器进程,则它会向Master机器发送一个“sync command”命令,请求同步连接。
第二步:无论是第一次连接还是重新连接,Master机器都会启动一个后台进程,将数据快照保存到数据文件中(执行rdb操作),同时Master还会记录修改数据的所有命令并缓存在数据文件中。
第三步:后台进程完成缓存操作之后,Maste机器就会向Slave机器发送数据文件,Slave端机器将数据文件保存到硬盘上,然后将其加载到内存中,接着Master机器就会将修改数据的所有操作一并发送给Slave端机器。若Slave出现故障导致宕机,则恢复正常后会自动重新连接。
第四步:Master机器收到Slave端机器的连接后,将其完整的数据文件发送给Slave端机器,如果Mater同时收到多个Slave发来的同步请求,则Master会在后台启动一个进程以保存数据文件,然后将其发送给所有的Slave端机器,确保所有的Slave端机器都正常。
4、Redis主从复制的搭建步骤
(1)环境配置
主机 |
操作系统 |
IP地址 |
安装包 |
Master |
CentOS7.6 |
192.168.32.11 |
redis-5.0.7.tar.gz |
Slave1 |
CentOS7.6 |
192.168.32.12 |
redis-5.0.7.tar.gz |
Slave2 |
CentOS7.6 |
192.168.32.13 |
redis-5.0.7.tar.gz |
(2)所有节点服务器关闭防火墙和系统安全机制
systemctl stop firewalld
systemctl disable firewalld
setenforce 0
(3)所有节点服务器安装Redis
yum install -y gcc gcc-c++ make
cd /opt
tar zxvf redis-5.0.7.tar.gz
cd /opt/redis-5.0.7/
make && make PREFIX=/usr/local/redis install
cd /opt/redis-5.0.7/utils
./install_server.sh
......
#回车四次后,手动输入,需要一次性输入正确
Please select the redis executable path [] /usr/local/redis/bin/redis-server
ln -s /usr/local/redis/bin/* /usr/local/bin/
(4)修改Master节点Redis配置文件
vim /etc/redis/6379.conf
bind 0.0.0.0
#70行,修改监听地址为 0.0.0.0
daemonize yes
#137行,开启守护进程
logfile /var/1og/redis_6379.1og
#172行,指定日志文件目录
dir /var/lib/redis/6379
#264行,指定工作目录
appendonly yes
#700行,开启 AOF 持久化功能
/etc/init.d/redis_6379 restart
#重启服务使配置生效
(5)修改Slave1/2节点Redis配置文件
vim /etc/redis/6379.conf
bind 0.0.0.0
#70行,修改监听地址为 0.0.0.0
daemonize yes
#137行,开启守护进程
logfile /var/log/redis_6379.log
#172行,指定日志文件目录
dir /var/lib/redis/6379
#264行,指定工作目录
replicaof 192.168.126.128 6379
#288行,指定要同步的 Master 节点 IP 和端口
appendonly yes
#700行,开启 AOF 持久化功能
/etc/init.d/redis_6379 restart
#重启服务使配置生效
(6)验证主从效果
①在Master节点验证
tail -f /var/log/redis_6379.log #查看主节点日志
redis-cli info replication #查看主从的详细信息
②在Slave节点验证
redis-cli info replication #查看从节点相关信息
二、Redis 哨兵模式
哨兵的核心功能:在主从复制的基础上,哨兵引入了主节点的自动故障转移
1、哨兵模式的原理
哨兵(sentinel):是一个分布式系统,用于对主从结构中的每台服务器进行监控,当出现故障时通过投票机制选择新的 Master 并将所有 Slave 连接到新的 Master。所以整个运行哨兵的集群的数量不得少于3个节点。
2、哨兵模式的作用
(1)集群监控:负责监控Redismaster和slave进程是否正常工作;
(2)消息通知:如果某个Redis实例有故障,那么哨兵负责发送消息作为报敬通知给管理员;
(3)故障转移:如果masternode挂掉了,会自动转移到slave node上;
(4)配置中心:如果故障转移发生了,通知client客户端新的master地址。
3、哨兵们监控整个系统节点的过程
(1)首先主节点的信息是配置在哨兵(Sentinel)的配置文件中。
(2)哨兵节点会和配置的主节点建立起两条连接命令连接和订阅连接。
PS:Redis发布订阅(pub/sub)是一种消息通信模式:发送者(pub)发送消 息,订阅者 (sub) 接收消息。
(3)哨兵会通过命令连接每10s发送一次INFO命令,通过INFO命令,主节点会返回自己的run_id和自己的从节点信息。
(4)哨兵会对这些从节点也建立两条连接命令连接和订阅连接。
(5)哨兵通过命令连接向从节点发送INFO命令,获取到他的一些信息: run id(redis服务器id) ;role(职能);从服务器的复制偏移量offset;其他。
(6)通过命令连接向服务器的sentinel:hello频道发送一条消息,内容包括自己的ip端口、run id、配置(后续投票的时候会用到)等。
(7)通过订阅连接对服务器的sentinel:hello频道做了监听,所以所有的向该频道发送的哨兵的消息都能被接受到。
(8)解析监听到的消息,进行分析提取,就可以知道还有那些别的哨兵服务节点也在监听这些主从节点了,更新结构体将这些哨兵节点记录下来。
(9)向观察到的其他的哨兵节点建立命令连接,没有订阅连接。
4、哨兵模式下的故障迁移
(1)主观下线
哨兵(Sentinel)节点会每秒一次的频率向建立了命令连接的实例发送PING命令,如果在down-after-milliseconds毫秒内没有做出有效响应包括(PONG/LOADING/MASTERDOWN)以外的响应,哨兵就会将该实例在本结构体中的状态标记为SRI_S_DOWN主观下线
(2)客观下线
当一个哨兵节点发现主节点处于主观下线状态是,会向其他的哨兵节点发出询问,该节点是不是已经主观下线了。如果超过配置参数quorum个节点认为是主观下线时,该哨兵节点就会将自己维护的结构体中该主节点标记为SRIO DOWN客观下线询问命令SENTINEL is-master-down-by-addr。
(3) master选举
在认为主节点客观下线的情况下,哨兵节点节点间会发起一次选举,命令为:SENTINEL is-master-down-by-addr,只是runid这次会将自己的runid带进去,希望接受者将自己设置为主节点。如果超过半数以上的节点返回将该节点标记为leacer的情况下,会有该leader对故障进行迁移。
(4)故障转移
在从节点中挑选出新的主节点:通讯正常,优先级排序优先级相同时选择offset最大的,将该节点设置成新的主节点SLAVEOF no one,并确保在后续的INGO命令时 该节点返回状态为master ,将其他的从节点设置成从新的主节点复制,SLAVEOF命令,将旧的主节点变成新的主节点的从节点。
PS:优缺点
优点:高可用,哨兵模式是基于主从模式的,所有主从模式的优点,哨兵模式都具有有;主从可以自动切换,系统更健壮,可用性更高。
缺点:redis比较难支持在线扩容,在群集容量达到上限时在线扩容会变得很复杂。
5、哨兵模式的搭建步骤
(1)环境配置
主机 |
操作系统 |
IP地址 |
安装包 |
Master |
CentOS7.6 |
192.168.32.11 |
redis-5.0.7.tar.gz |
Slave1 |
CentOS7.6 |
192.168.32.12 |
redis-5.0.7.tar.gz |
Slave2 |
CentOS7.6 |
192.168.32.13 |
redis-5.0.7.tar.gz |
(2)所有节点服务器关闭防火墙和系统安全机制
systemctl stop firewalld
systemctl disable firewalld
setenforce 0
(3)所有节点服务器安装Redis
yum install -y gcc gcc-c++ make
cd /opt
tar zxvf redis-5.0.7.tar.gz
cd /opt/redis-5.0.7/
make && make PREFIX=/usr/local/redis install
cd /opt/redis-5.0.7/utils
./install_server.sh
......
#回车四次后,手动输入,需要一次性输入正确
Please select the redis executable path [] /usr/local/redis/bin/redis-server
ln -s /usr/local/redis/bin/* /usr/local/bin/
(4)修改所有节点Redis配置文件
vim /opt/redis-5.0.9/sentinel.conf
#17行,关闭保护模式
protected-mode no
#21行,Redis哨 兵默认的监听端口
port 26379
#26行 开启守护进程
daemonize yes
#36行,指定日志存放路径
logfile "/var/log/sentinel.log"
#65行,指定数据库存放路径
dir "/var/lib/redis/6379"
#84行,指定哨兵节点
#2表示,至少需要 2 个哨兵节点同意,才能判定主节点故障并进行故障转移
sentinel monitor mymaster 192.168.32.11 6379 2
#113行,判定服务器down掉的时间周期,默认30000毫秒 (30秒 )
sentinel down-after-milliseconds mymaster 3000
#146行,故障节点的最大超时时间为180000 (180秒)
sentinel failover-timeout mymaster 180000
(5)启动哨兵模式
①先启动Master节点
①后启动Slave1和Slave2节点
三、Redis 群集模式
1、redis群集的概念
(1)集群,即Redis Cluster,是Redis 3.0开始引入的分布式存储方案。
(2)集群由多个节点(Node)组成,Redis的数据分布在这些节点中。集群中的节点分为主节点和从节点:只有主节点负责读写请求和集群信息的维护;从节点只进行主节点数据和状态信息的复制。
2、集群的作用
(1)数据分区
数据分区(或称数据分片)是集群最核心的功能。
集群将数据分散到多个节点,一方面突破了Redis单机内存大小的限制,存储容量大大增加;另一方面每个主节点都可以对外提供读服务和写服务,大大提高了集群的响应能力。
Redis单机内存大小受限问题,在介绍持久化和主从复制时都有提及;例如,如果单机内存太大,bgsave和bgrewriteaof的fork操作可能导致主进程阻塞,主从环境下主机切换时可能导致从节点长时间无法提供服务,全量复制阶段主节点的复制缓冲区可能溢出。
(2)高可用
集群支持主从复制和主节点的自动故障转移(与哨兵类似);当任一节点发生故障时,集群仍然可以对外提供服务。
3、Redis集群的数据分片
(1)Redis集群引入了哈希槽的概念
(2)Redis集群有16384个哈希槽(编号0-16383)
(3)集群的每个节点负责一部分哈希槽
(4)每个Key通过CRC16校验后对16384取余来决定放置哪个哈希槽,通过这个值,去找到对应的插槽所对应的节点,然后直接自动跳转到这个对应的节点上进行存取操作
以3个节点组成的集群为例
节点A包含0到5460号哈希槽
节点B包含5461到10922号哈希槽
节点C包含10923到16383号哈希槽
(5)Redis集群的主从复制模型
集群中具有A、B、C三个节点,如果节点B失败了,整个集群就会因缺少5461-10922这个范围的槽而不可以用。
为每个节点添加一个从节点A1、B1、C1整个集群便有三个Master节点和三个slave节点组成,在节点B失败后,集群选举B1位为的主节点继续服务。当B和B1都失败后,集群将不可用
4、搭建Redis 群集模式
(1)环境配置
主机 | 操作系统 | IP地址:端口 | 安装包 |
Master1 | CentOS7.6 | 192.168.32.11:6001 | redis-5.0.7.tar.gz |
Master2 | CentOS7.6 | 192.168.32.12:6002 | redis-5.0.7.tar.gz |
Master3 | CentOS7.6 | 192.168.32.13:6003 | redis-5.0.7.tar.gz |
Slave1 | CentOS7.6 | 192.168.32.14:6004 | redis-5.0.7.tar.gz |
Slave2 | CentOS7.6 | 192.168.32.15:6005 | redis-5.0.7.tar.gz |
Slave3 | CentOS7.6 | 192.168.32.16:6006 | redis-5.0.7.tar.gz |
(2)创建并复制相关文件(在所有节点服务器上配置)
Master1:
cd /etc/redis/
mkdir -p redis-cluster/redis6001
cp /opt/redis-5.0.7/redis.conf /etc/redis/redis-cluster/redis6001/
cp /opt/redis-5.0.7/src/redis-cli /opt/redis-5.0.7/src/redis-server /etc/redis/redis-cluster/redis6001/
Master2:
cd /etc/redis/
mkdir -p redis-cluster/redis6002
cp /opt/redis-5.0.7/redis.conf /etc/redis/redis-cluster/redis6002/
cp /opt/redis-5.0.7/src/redis-cli /opt/redis-5.0.7/src/redis-server /etc/redis/redis-cluster/redis6002/
Master3:
cd /etc/redis/
mkdir -p redis-cluster/redis6003
cp /opt/redis-5.0.7/redis.conf /etc/redis/redis-cluster/redis6003/
cp /opt/redis-5.0.7/src/redis-cli /opt/redis-5.0.7/src/redis-server /etc/redis/redis-cluster/redis6003/
Slave1:
cd /etc/redis/
mkdir -p redis-cluster/redis6004
cp /opt/redis-5.0.7/redis.conf /etc/redis/redis-cluster/redis6004/
cp /opt/redis-5.0.7/src/redis-cli /opt/redis-5.0.7/src/redis-server /etc/redis/redis-cluster/redis6004/
Slave2:
cd /etc/redis/
mkdir -p redis-cluster/redis6005
cp /opt/redis-5.0.7/redis.conf /etc/redis/redis-cluster/redis6005/
cp /opt/redis-5.0.7/src/redis-cli /opt/redis-5.0.7/src/redis-server /etc/redis/redis-cluster/redis6005/
Slave3:
cd /etc/redis/
mkdir -p redis-cluster/redis6006
cp /opt/redis-5.0.7/redis.conf /etc/redis/redis-cluster/redis6006/
cp /opt/redis-5.0.7/src/redis-cli /opt/redis-5.0.7/src/redis-server /etc/redis/redis-cluster/redis6006/
(3)修改配置文件,开启群集功能(在所有节点服务器上配置)
Master1:
vim /etc/redis/redis-cluster/redis6001/redis.conf
#69行,修改bind项,监听自己的IP
bind 192.168.32.11
#88行,修改,关闭保护模式
protected-mode no
#92行,修改,redis监听端口
port 6371
#136行,以独立进程启动
daemonize yes
#699行,修改,开启AOF持久化
appendonly yes
#832行,取消注释,开启群集功能
cluster-enabled yes
#840行,取消注释,修改,群集名称文件设置
cluster-config-file nodes-6001.conf
#846行,取消注释,群集超时时间设置
cluster-node-timeout 15000
Master2:
vim /etc/redis/redis-cluster/redis6002/redis.conf
#69行,修改bind项,监听自己的IP
bind 192.168.32.12
#88行,修改,关闭保护模式
protected-mode no
#92行,修改,redis监听端口
port 6371
#136行,以独立进程启动
daemonize yes
#699行,修改,开启AOF持久化
appendonly yes
#832行,取消注释,开启群集功能
cluster-enabled yes
#840行,取消注释,修改,群集名称文件设置
cluster-config-file nodes-6002.conf
#846行,取消注释,群集超时时间设置
cluster-node-timeout 15000
Master3:
vim /etc/redis/redis-cluster/redis6003/redis.conf
#69行,修改bind项,监听自己的IP
bind 192.168.32.13
#88行,修改,关闭保护模式
protected-mode no
#92行,修改,redis监听端口
port 6371
#136行,以独立进程启动
daemonize yes
#699行,修改,开启AOF持久化
appendonly yes
#832行,取消注释,开启群集功能
cluster-enabled yes
#840行,取消注释,修改,群集名称文件设置
cluster-config-file nodes-6003.conf
#846行,取消注释,群集超时时间设置
cluster-node-timeout 15000
Slave1:
vim /etc/redis/redis-cluster/redis6004/redis.conf
#69行,修改bind项,监听自己的IP
bind 192.168.32.14
#88行,修改,关闭保护模式
protected-mode no
#92行,修改,redis监听端口
port 6371
#136行,以独立进程启动
daemonize yes
#699行,修改,开启AOF持久化
appendonly yes
#832行,取消注释,开启群集功能
cluster-enabled yes
#840行,取消注释,修改,群集名称文件设置
cluster-config-file nodes-6004.conf
#846行,取消注释,群集超时时间设置
cluster-node-timeout 15000
Slave2:
vim /etc/redis/redis-cluster/redis6005/redis.conf
#69行,修改bind项,监听自己的IP
bind 192.168.32.15
#88行,修改,关闭保护模式
protected-mode no
#92行,修改,redis监听端口
port 6371
#136行,以独立进程启动
daemonize yes
#699行,修改,开启AOF持久化
appendonly yes
#832行,取消注释,开启群集功能
cluster-enabled yes
#840行,取消注释,修改,群集名称文件设置
cluster-config-file nodes-6005.conf
#846行,取消注释,群集超时时间设置
cluster-node-timeout 15000
Slave3:
vim /etc/redis/redis-cluster/redis6006/redis.conf
#69行,修改bind项,监听自己的IP
bind 192.168.32.16
#88行,修改,关闭保护模式
protected-mode no
#92行,修改,redis监听端口
port 6371
#136行,以独立进程启动
daemonize yes
#699行,修改,开启AOF持久化
appendonly yes
#832行,取消注释,开启群集功能
cluster-enabled yes
#840行,取消注释,修改,群集名称文件设置
cluster-config-file nodes-6006.conf
#846行,取消注释,群集超时时间设置
cluster-node-timeout 15000
(3)启动redis节点(在所有节点服务器上操作)
Master1:
cd /etc/redis/redis-cluster/redis6001/
redis-server redis.conf
ps -ef | grep redis
Master2:
cd /etc/redis/redis-cluster/redis6002/
redis-server redis.conf
ps -ef | grep redis
Master3:
cd /etc/redis/redis-cluster/redis6003/
redis-server redis.conf
ps -ef | grep redis
Slave1:
cd /etc/redis/redis-cluster/redis6004/
redis-server redis.conf
ps -ef | grep redis
Slave2:
cd /etc/redis/redis-cluster/redis6005/
redis-server redis.conf
ps -ef | grep redis
Slave3:
cd /etc/redis/redis-cluster/redis6006/
redis-server redis.conf
ps -ef | grep redis
(4)启动集群
redis-cli --cluster create 192.168.32.11:6001 192.168.32.12:6002 192.168.32.13:6003 192.168.32.14:6004 192.168.32.15:6005 192.168.32.16:6006 --cluster-replicas 1
>>> Performing hash slots allocation on 6 nodes...
Master[0] -> Slots 0 - 5460
Master[1] -> Slots 5461 - 10922
Master[2] -> Slots 10923 - 16383
Adding replica 192.168.32.15:6005 to 192.168.32.11:6001
Adding replica 192.168.32.16:6006 to 192.168.32.12:6002
Adding replica 192.168.32.14:6004 to 192.168.32.13:6003
M: 5bf979ecd1c01c57648542a088010c4854fdde4f 192.168.32.11:6001
slots:[0-5460] (5461 slots) master
M: eeed8c6ad006db8b864b58f8840034b803734b88 192.168.32.12:6002
slots:[5461-10922] (5462 slots) master
M: 5c382fec73993a3b25766105d852f91eccc8c869 192.168.32.13:6003
slots:[10923-16383] (5461 slots) master
S: cf074c513c1d4eb2091901c5aee158dd8718a293 192.168.32.14:6004
replicates 5c382fec73993a3b25766105d852f91eccc8c869
S: bb3c3aaf2651f24dc3abc3004bc359bfaab4e4de 192.168.32.15:6005
replicates 5bf979ecd1c01c57648542a088010c4854fdde4f
S: c7670fdfefdbaf3fa9760f89198168d9bdb321f0 192.168.32.16:6006
replicates eeed8c6ad006db8b864b58f8840034b803734b88
Can I set the above configuration? (type 'yes' to accept): yes
>>> Nodes configuration updated
>>> Assign a different config epoch to each node
>>> Sending CLUSTER MEET messages to join the cluster
Waiting for the cluster to join
....
>>> Performing Cluster Check (using node 192.168.32.11:6001)
M: 5bf979ecd1c01c57648542a088010c4854fdde4f 192.168.32.11:6001
slots:[0-5460] (5461 slots) master
1 additional replica(s)
S: c7670fdfefdbaf3fa9760f89198168d9bdb321f0 192.168.32.16:6006
slots: (0 slots) slave
replicates eeed8c6ad006db8b864b58f8840034b803734b88
S: cf074c513c1d4eb2091901c5aee158dd8718a293 192.168.32.14:6004
slots: (0 slots) slave
replicates 5c382fec73993a3b25766105d852f91eccc8c869
S: bb3c3aaf2651f24dc3abc3004bc359bfaab4e4de 192.168.32.15:6005
slots: (0 slots) slave
replicates 5bf979ecd1c01c57648542a088010c4854fdde4f
M: eeed8c6ad006db8b864b58f8840034b803734b88 192.168.32.12:6002
slots:[5461-10922] (5462 slots) master
1 additional replica(s)
M: 5c382fec73993a3b25766105d852f91eccc8c869 192.168.32.13:6003
slots:[10923-16383] (5461 slots) master
1 additional replica(s)
[OK] All nodes agree about slots configuration.
>>> Check for open slots...
>>> Check slots coverage...
[OK] All 16384 slots covered.
(5)测试集群
[root@localhost redis]# redis-cli -h 192.168.32.11 -p 6001 -c
192.168.32.11:6001> cluster slots
1) 1) (integer) 0
2) (integer) 5460
3) 1) "192.168.32.11"
2) (integer) 6001
3) "5bf979ecd1c01c57648542a088010c4854fdde4f"
4) 1) "192.168.32.15"
2) (integer) 6005
3) "bb3c3aaf2651f24dc3abc3004bc359bfaab4e4de"
2) 1) (integer) 5461
2) (integer) 10922
3) 1) "192.168.32.12"
2) (integer) 6002
3) "eeed8c6ad006db8b864b58f8840034b803734b88"
4) 1) "192.168.32.16"
2) (integer) 6006
3) "c7670fdfefdbaf3fa9760f89198168d9bdb321f0"
3) 1) (integer) 10923
2) (integer) 16383
3) 1) "192.168.32.13"
2) (integer) 6003
3) "5c382fec73993a3b25766105d852f91eccc8c869"
4) 1) "192.168.32.14"
2) (integer) 6004
3) "cf074c513c1d4eb2091901c5aee158dd8718a293"
192.168.32.11:6001> set test lisi
-> Redirected to slot [6918] located at 192.168.32.12:6002
OK
192.168.32.12:6002> cluster keyslot test
(integer) 6918
192.168.32.12:6002> get test
"lisi"
192.168.32.12:6002> quit
[root@localhost redis]# redis-cli -h 192.168.32.15 -p 6005 -c
192.168.32.15:6005> get test
-> Redirected to slot [6918] located at 192.168.32.12:6002
"lisi"
192.168.32.12:6002> exit
总结
1、主从复制过程:①首先slave节点向master发送sync_command申请同步;②此时master主进程会派生RDB子进程进行持久化,将生成RDB文件;③将生成的RDB文件推送给slaves(完成全量同步);④使用增量同步是通过AOF功能,将缓存中的数据append(追加)同步给slaves缓冲区数据;⑤持续性运行中的数据,也是使用AOF功能进行增量同步。
2、哨兵们监控整个系统节点的过程:①哨兵之间相互监听,使用ping来相互检查是否存活;②哨兵会分别向数据节点(master)发送命令连接和订阅连接(info命令)获取数据节点信息(包含主从节点);③哨兵再向其他从节点发送info命令,用于获取从节点详细信息;④哨兵之间通过hello频道进行消息共享。
3、集群内设置了16384(0-16383)个slot(哈希槽)。