Redis 主从复制、哨兵以及Cluster群集的搭建

目录


一、高可用技术

  • 主从复制:主从复制是高可用redis的基础,主从复制主要实现了数据的多机备份,以及对于读操作的负载均衡和简单的故障恢复。
    哨兵和集群都是在主从复制基础上实现高可用的。
    缺点:故障恢复无法自动化,写操作无法负载均衡,存储能力受到单机的限制。
  • 哨兵:在主从复制的基础上,哨兵实现了自动化的故障恢复。
    缺点:写操作无法负载均衡,存储能力受到单机的限制,哨兵无法对从节点进行自动故障转移,在读写分离的场景下,从节点故障会导致读服务不可用,需要对从节点做额外的监控切换操作。
  • 集群:通过集群,redis解决了写操作无法负载均衡,以及存储能力受到单机限制的问题,实现了较为完善的高可用方案。

二、 Redis主从复制

1. 主从复制的概念

主从复制,是指将一台Redis服务器的数据,复制到其他的Redis服务器。前者称为主节点(Master),后者称为从节点(Slave);数据的复制是单向的,只能由主节点到从节点。
默认情况下,每台Redis服务器都是主节点;且一个主节点可以有多个从节点(或没有从节点),但一个从节点只能有一个主节点。

2. 主从复制的作用

a)数据冗余:主从复制实现了数据的热备份,是持久化之外的一种数据冗余方式。
b)故障恢复:当主节点出现问题时,可以由从节点提供服务,实现快速的故障恢复;实际上是一种服务的冗余。
c)负载均衡:在主从复制的基础上,配合读写分离,可以由主节点提供写服务,由从节点提供读服务(即写Redis数据时应用连接主节点,读Redis数据时应用连接从节点),分担服务器负载;尤其是在写少读多的场景下,通过多个从节点分担读负载,可以大大提高Redis服务器的并发量。
d)高可用基石:除了上述作用以外,主从复制还是哨兵和集群能够实施的基础,因此说主从复制是Redis高可用的基础。

3. 主从复制工作流程

Redis 主从复制、哨兵以及Cluster群集的搭建

  • ① 当启动一个 slave 进程时,会向 Master 发送一个 “sync_command” 命令,请求同步连接
  • ② Master 会启动一个后台进程,触发 RDB 持久化操作,生成 RDB 快照文件,记录修改数据的所有命令并缓存在数据文件中
  • ③ 当后台进程完成缓存操作后,Master 会向 Slave 发送数据文件,Slave 先将数据保存到硬盘中然后再加载到内存中,接着 Master 就会将修改数据的所有操作一起发送给 Slave 端,如果Slave出现了故障导致宕机,则恢复正常后会自动重新连接
  • ④ Master 收到 Slave 端机器的连接后,将完整的数据文件发送给 Slave 端的机器,如果 Master 同时收到多个 Slave 发来的同步请求,则会在后台启动一个进程来保存数据文件,然后将其发送给所有的 Slave 端机器,确保所有的 Slave 端机器都保持正常

4. 主从复制的搭建

  • 环境准备
节点名 IP地址
master 192.168.16.21
slave1 192.168.16.20
slave2 192.168.16.22

三台服务器均需安装 redis

systemctl stop firewalld
setenforce 0
 
yum install -y gcc gcc-c++ make
 
tar zxvf redis-5.0.7.tar.gz -C /opt/
 
cd /opt/redis-5.0.7/
make PREFIX=/usr/local/redis install
 
cd /opt/redis-5.0.7/utils
./install_server.sh
 
回车四次,下一步需要手动输入
Please select the redis executable path [] /usr/local/redis/bin/redis-server   
ln -s /usr/local/redis/bin/* /usr/local/bin/



  • 修改主配置文件
---------------------------------------Master节点--------------------------------------------

vim /etc/redis/6379.conf 
 70 bind 0.0.0.0							#修改监听地址为0.0.0.0
 137 daemonize yes							#开启守护进程
 172 logfile /var/log/redis_6379.log		#指定日志文件的目录位置
 264 dir /var/lib/redis/6379				#指定工作目录
700 appendonly yes							#开启AOF持久化功能

/etc/init.d/redis_6379 restart				#重启服务
netstat -antp |grep redis					#查看redis状态

---------------------------------------Slave节点-------------------------------------------------
vim /etc/redis/6379.conf
70 bind 0.0.0.0 		 					#修改监听地址为0.0.0.0
137 daemonize yes		 					#开启守护进程
172 logfile/var/log/redis_6379.log			#指定日志文件的目录位置
264 dir /var/lib/redis/6379		 			#指定工作目录
288 replicaof 192.168.16.21 6379		 		#添加一条指定要同步的Master节点IP和端口
700 appendonly yes		 					#开启AOF持久化功能
/etc/init.d/redis_6379 restart	 			#重启服务使使配置生效
  • 验证效果
[root@master ~]#tail -f /var/log/redis_6379.log 
1935:M 11 Nov 2021 22:16:05.427 * Background saving terminated with success
1935:M 11 Nov 2021 22:16:05.428 * Synchronization with replica 192.168.16.20:6379 succeeded
1935:M 11 Nov 2021 22:21:08.206 * Replica 192.168.16.22:6379 asks for synchronization
1935:M 11 Nov 2021 22:21:08.206 * Full resync requested by replica 192.168.16.22:6379
1935:M 11 Nov 2021 22:21:08.206 * Starting BGSAVE for SYNC with target: disk
1935:M 11 Nov 2021 22:21:08.207 * Background saving started by pid 2066
2066:C 11 Nov 2021 22:21:08.214 * DB saved on disk
2066:C 11 Nov 2021 22:21:08.214 * RDB: 4 MB of memory used by copy-on-write
1935:M 11 Nov 2021 22:21:08.221 * Background saving terminated with success
1935:M 11 Nov 2021 22:21:08.221 * Synchronization with replica 192.168.16.22:6379 succeeded
[root@master ~]#redis-cli info replication
# Replication
role:master														#角色是master
connected_slaves:2												#连接从服务器2个
slave0:ip=192.168.16.20,port=6379,state=online,offset=2380,lag=1	
slave1:ip=192.168.16.22,port=6379,state=online,offset=2380,lag=0

#master启动时生成的40位16进制的随机字符串,用来标识master节点,切换主从的时候master节点标识会有更改
master_replid:d298c44232b14f3e6937165c188b350aa7b28569

#复制流中的一个偏移量,master处理完写入命令后,会把命令的字节长度做累加记录,统计在该字段。该字段也是实现部分复制的关键字段
master_replid2:0000000000000000000000000000000000000000
master_repl_offset:2380

#无论主从,以下内容都表示自己上次主实例repid1和复制偏移量;用于兄弟实例或级联复制,主库故障切换psync
second_repl_offset:-1
repl_backlog_active:1
repl_backlog_size:1048576
repl_backlog_first_byte_offset:1
repl_backlog_histlen:2380
  • 在Master上创建 cui 键,并在Slave上查看是否同步
[root@master ~]#redis-cli 
127.0.0.1:6379> SET cui 1
OK
127.0.0.1:6379> GET cui
"1"

Redis 主从复制、哨兵以及Cluster群集的搭建

Redis 主从复制、哨兵以及Cluster群集的搭建

三、 哨兵模式

1. 哨兵模式集群架构

  • 哨兵是 Redis 集群架构中非常重要的一个组件
  • 哨兵的出现主要是解决了主从复制出现故障时需要人为干预的问题

2. 哨兵的模式和功能

  • 集群监控:负责监控 Redismaster 和 slave 进程是否正常工作
  • 消息通知:如果某个 Redis 实例有故障,那么哨兵负责发送消息作为报敬通知给管理员
  • 故障转移:如果 masternode 挂掉了,会自动转移到 slave node 上
  • 配置中心:如果故障转移发生了,通知 client 客户端新的 master 地址

使用一个或者多个哨兵(Sentinel)实例组成的系统,对 redis 节点进行监控
在主节点出现故障的情况下,能将从节点中的一个升级为主节点,进行故障转移,保证系统的可用性。

3. 监控过程

  • ① 首先主节点的信息是配置在哨兵(Sentinel)的配置文件中

  • ② 哨兵节点会和配置的主节点建立起两条连接命令连接和订阅连接

  • ③ 哨兵会通过命令连接每 10s 发送一次 INFO 命令,通过 INFO 命令,主节点会返回自己的 run_id 和自己的从节点信息

  • ④ 哨兵会对这些从节点也建立两条连接命令连接和订阅连接

  • ⑤ 哨兵通过命令连接向从节点发送 INFO 命令,获取到他的一些信息——run id(redis服务器id)、role(职能)、从服务器的复制偏移量offset

  • ⑥ 通过命令连接向服务器的 sentinel:hello 频道发送一条消息,内容包括自己的ip端口、run id、配置(后续投票的时候会用到)等

  • ⑦ 通过订阅连接对服务器的 sentinel:hello 频道做了监听,所以所有的向该频道发送的哨兵的消息都能被接受到

  • ⑧ 解析监听到的消息,进行分析提取,就可以知道还有那些别的哨兵服务节点也在监听这些主从节点了,更新结构体将这些哨兵节点记录下来

  • ⑨ 向观察到的其他的哨兵节点建立命令连接——没有订阅连接

4. 哨兵模式下的故障迁移

  • ① 主观下线
    哨兵(Sentinel)节点会每秒一次的频率向建立了命令连接的实例发送PING命令,如果在down-after-milliseconds毫秒内没有做出有效响应包括(PONG/ LOADING/MASTERDOWN)以外的响应,哨兵就会将该实例在本结构体中的状态标记为SRI_s_DOWN主观下线
  • ② 客观下线
    当一个哨兵节点发现主节点处于主观下线状态是,会向其他的哨兵节点发出询问,该节点是不是已经主观下线了。如果超过配置参数quorum个节点认为是主观下线时,该哨兵节点就会将自己维护的结构体中该主节点标记为SRIO DOWN客观下线询问命令SENTINEL is-master-down-by-addr
  • ③ master选举
    在认为主节点客观下线的情况下,哨兵节点节点间会发起一.次选举,命令为:SENTINEL is-master-down-by-addr只是runid这次会将自己的runid带进去, 希望接受者将自己设置为主节点。如果超过半数以.上的节点返回将该节点标记为leacer的情况下,会有该leader对故障进行迁移
  • ④ 故障转移
    在从节点中挑选出新的主节点
    通讯正常
    优先级排序
    优先级相同时选择offset最大的( 最接近master的)
    将该节点设置成新的主节点SLAVEOFnoone,并确保在后续的INGO命令时该节点返回状态为master
    将其他的从节点设置成从新的主节点的从节点,SLAVEQF命令
    将旧的主节点变成新的主节点的从节点

5. 哨兵模式的搭建

哨兵的启动依赖于主从模式,所以须把主从模式安装好的情况下再去做哨兵模式,所以节点上都需要部署哨兵模式,哨兵模式会监控所有的 Redis 工作节点是否正常

  • 环境准备
节点名 IP地址
master 192.168.16.21
slave1 192.168.16.20
slave2 192.168.16.22
  • 修改配置文件(所有节点)
vim /opt/redis-5.0.7/sentinel.conf

17 protected-mode no		 								#关闭保护模式
21 port 26379		 										#Redis哨兵默认的监听端口
26 daemonize yes		 									#开启守护进程
36 logfile "/var/log/sentinel.log"		 					#指定日志存放路径
65 dir /var/lib/redis/6379		 							#指定数据库存放路径
84 sentinel monitor mymaster 192.168.16.21 6379 2	 		#指定哨兵节点;2:至少需要2个哨兵节点同意,才能判定主节点故障并进行故障转移
113 sentinel down-after-milliseconds mymaster 30000		 	#判定服务器down掉的时间周期,默认30000毫秒 (30秒)
146 sentinel failover- timeout mymaster 180000		 		#故障节点的最大超时时间为180000 (180秒)
  • 启动哨兵模式(先启动主节点)
cd /opt/redis-5.0.7/

#使用redis-sentinel启动,再使用sentinel.conf
redis-sentinel sentinel.conf &	
redis-cli -p 26379 info sentinel		#查看哨兵信息	

Redis 主从复制、哨兵以及Cluster群集的搭建
Redis 主从复制、哨兵以及Cluster群集的搭建
Redis 主从复制、哨兵以及Cluster群集的搭建

  • 模拟故障
netstat -antp | grep redis					#查看redis-server的进程号
kill -9 66229								#杀死Master 节点_上的redis-server 的进程号

Redis 主从复制、哨兵以及Cluster群集的搭建

  • 验证结果
#查看哨兵信息——》status会从sdown->odown->ok,快速变化
watch -n 1 redis-cli -p 26379 info sentinel	 
同时master切换为192.168.16.20 	

Redis 主从复制、哨兵以及Cluster群集的搭建
Redis 主从复制、哨兵以及Cluster群集的搭建

status=sdown   					 	#s表示主观下线
status=odown 						#o即objectively客观下线

四、 Cluster 群集

主节点负责读写请求和集群信息的维护,从节点只进行主节点数据和状态信息的复制

1. 作用

  • 数据分区
    数据分区(或称数据分片)是集群最核心的功能。
    集群将数据分散到多个节点,一方面突破了Redis单机内存大小的限制,存储容量大大增加;另一方面每个主节点度可以对外提供读服务和写服务,大大提高了集群的响应能力。
    Redis单机内存大小受限问题,在介绍持久化和主从复制时都有体积;例如,如果单机内存太大,bgsave和bgrewriteaof的fork操作可能导致主进程阻塞,主从环境下主机切换时可能导致从节点长时间无法提供服务,全量复制阶段主节点的复制缓冲区可能溢出。

  • 高可用
    集群支持主从复制和主节点的自动故障转换(与哨兵类似);当任一节点发生故障时,集群仍然可以对外提供服务。

  • 数据分片
    Redis 集群引入了哈希槽的概念,有16384 个哈希槽(编号0~16383)
    集群的每个节点负责一部分哈希槽,每个 Key 通过 CRC16 校验后对 16384 取余来决定放置哪个哈希槽,通过这个值,去找到对应的插槽所对应的节点,然后直接自动跳转到这个对应的节点上进行存取操作
    以3个节点组成的集群为例:
    节点A包含0~5469号的哈希槽
    节点B包含5461~10922号的哈希槽
    节点C包含10923~16383 号的哈希槽

2. 搭建Cluster集群

redis 的集群一般需要6个节点,3主3从;
为了方便,这里所有节点在同一台服务器上模拟以端口号进行区分;
3个主节点端口号: 6001/6002/6003, 对应的从节点端口号: 6004/ 6005/ 6006

  • 创建6个端口的工作目录
cd /etc/redis/
mkdir -p redis-cluster/redis600{1..6}

Redis 主从复制、哨兵以及Cluster群集的搭建

vim /opt/redis.sh

#!/bin/bash
for i in {1..6}
do
cp /opt/redis-5.0.7/redis.conf /etc/redis/redis-cluster/redis600$i
cp /opt/redis-5.0.7/src/redis-cli /opt/redis-5.0.7/src/redis-server /etc/redis/redis-	cluster/redis600$i
done

sh -x /opt/redis.sh

Redis 主从复制、哨兵以及Cluster群集的搭建
Redis 主从复制、哨兵以及Cluster群集的搭建

  • 修改6个 redis 的配置文件
cd /etc/redis/redis-cluster/redis6001

vim redis.conf
	69 bind 127.0.0.1		 			 		 #注释掉bind项或不修改,默认监听所有网卡
	88 protected -mode no				 		 #修改,关闭保护模式
	92 port 6001		 						 #修改,redis监听端口
	136 daemonize yes		 					 #开启守护进程,以独立进程启动
	832 cluster-enabled yes		 				 # 取消注释,开启群集功能
	840 cluster-config-file nodes-6001.conf		 #取消注释,群集名称文件设置
	846 cluster-node-timeout 15000		 		 #取消注释群集超时时间设置
	700 appendonly yes							 #开启AOF持久化

#其他五个配置文件除端口号和文件名称外其余改动相同,复制redis6001至redis6002-6006
[root@localhost /etc/redis/redis-cluster/redis6001]#cp redis.conf ../redis6002/
cp:是否覆盖"../redis6002/redis.conf"? y 
[root@localhost /etc/redis/redis-cluster/redis6001]#cp redis.conf ../redis6003/
cp:是否覆盖"../redis6003/redis.conf"? y
[root@localhost /etc/redis/redis-cluster/redis6001]#cp redis.conf ../redis6004/
cp:是否覆盖"../redis6004/redis.conf"? y
[root@localhost /etc/redis/redis-cluster/redis6001]#cp redis.conf ../redis6005/
cp:是否覆盖"../redis6005/redis.conf"? y
[root@localhost /etc/redis/redis-cluster/redis6001]#cp redis.conf ../redis6006/
cp:是否覆盖"../redis6006/redis.conf"? y
cd /etc/redis/redis-cluster/
cd redis6006/												#每一个都需要改
vim redis.conf 

	92 port 6006											#6002,6003,6004,6005,6006
	840  cluster-config-file nodes-6006.conf				#同上
  • 启动服务

可以手动启动六次或者写入脚本执行脚本

#手动启动六次
cd /etc/redis/redis-cluster/redis6001
redis-server redis.conf								#启动服务

#写入脚本执行脚本 
vim /opt/redis_start.sh								#根据对应配置文件启动redis

	#!/bin/bash
	for d in {1..6}
	do
	cd /etc/redis/redis-cluster/redis600$d
	redis-server redis.conf
	done
	
sh -x /opt/redis_start.sh
ps -ef | grep redis

Redis 主从复制、哨兵以及Cluster群集的搭建

Redis 主从复制、哨兵以及Cluster群集的搭建

  • 加入集群
redis-cli --cluster create 127.0.0.1:6001 127.0.0.1:6002 127.0.0.1:6003 127.0.0.1:6004 127.0.0.1:6005 127.0.0.1:6006 --cluster-replicas 1	

Redis 主从复制、哨兵以及Cluster群集的搭建

  • 测试
[root@localhost /etc/redis/redis-cluster/redis6001]#redis-cli -p 6001 -c       #加-c参数,节点之间就可以互相跳转
127.0.0.1:6001> CLUSTER SLOTS								#查看节点的哈希槽编号范围
1) 1) (integer) 5461
   2) (integer) 10922
   3) 1) "127.0.0.1"
      2) (integer) 6002
      3) "1cd7723fd9e4108593d6327fcf2105ca0d8d885c"
   4) 1) "127.0.0.1"
      2) (integer) 6005
      3) "24c84d7a2faef7914b6b114762db051854b4bcdd"
2) 1) (integer) 10923
   2) (integer) 16383
   3) 1) "127.0.0.1"
      2) (integer) 6003
      3) "459b1db2b7314a99b31fb30819a63700a7d5b2e6"
   4) 1) "127.0.0.1"
      2) (integer) 6006
      3) "c37f3bfcf44e5f9b4938685d2bc1841898ad08d4"
3) 1) (integer) 0
   2) (integer) 5460
   3) 1) "127.0.0.1"
      2) (integer) 6001
      3) "1311cf5074758ac6d3512534fea9f51175ebfa82"
   4) 1) "127.0.0.1"
      2) (integer) 6004
      3) "0902e7035abc0d2719e2d0b7d1d9d2d0796ef3d4"
127.0.0.1:6001> set name gl									#新建的键,验证是否会分配到指定哈希槽
-> Redirected to slot [5798] located at 127.0.0.1:6002
OK
127.0.0.1:6002> CLUSTER KEYSLOT gl
(integer) 16279
127.0.0.1:6002> 

总结

  • redis 主从复制
    ① slave 向 master 发送 sync同步请求
    ② master 使用 RDB 生成 RDB 文件(全量同步)发送给 slaves
    ③ master 使用 AOF 将缓冲区数据同步给 slaves 缓冲区数据(增量同步)

  • 哨兵的监控模式
    ① 三个哨兵之间建立命令连接,周期检测“队友”的状态
    ② 哨兵会向master节点(配置文件中已指定)发送两条连接,分别是命令连接喝订阅连接(为了周期性获得master节点的数据)
    ③ 哨兵向master周期性发送info命令,master(存活的情况下)会返回redis-cli info replication master 节点的信息和从节点位置
    ④ 哨兵通过master返回的信息,再向slaves节点放info命令,slaves返回数据,从而哨兵集群就可以获得到redis所有集群信息
    ⑤ 哨兵会向服务器发送命令连接,建立自己的hello频道,哨兵会向这个频道建立订阅,用于哨兵之间的消息共享

思路:
三个哨兵互相监听,使用ping命令互相检测存货
三个哨兵分别向数据节点master发送命令连接和订阅连接(info命令)获取数据节点信息(包含主从节点)
三个哨兵再向其他节点发送info,用于获取从节点详细信息
三个哨兵之间通过hello频道进行消息共享

上一篇:自然语言处理实验—用K-means的方法对样本特征分类(含python代码和详细例子解释)


下一篇:Redis集群模式