Redis6.x学习笔记（四）复制

2022-10-04 07:38:57

复制概述

Redis支持复制的功能，以实现当一台服务器的数据更新后，自动将新的数据异步同步到其它数据库。

Redis复制实现中，把数据库分为主数据库master和从数据库slave，主数据库可以进行读写操作，从数据库一般是只读的，当主数据库数据变化的时候，会自动同步给从数据库。

复制带来的好处

1：可以实现读写分离
2：利于在主数据库崩溃时的数据恢复
3：水平扩容支撑高并发

复制基本配置

主数据库不做配置；
从数据库需要在配置中设置“replicaof 主数据库ip 主数据库端口”

复制的基本操作命令

1：info replication ：可以查看复制节点的相关信息

2：slaveof：可在运行期间修改slave节点的信息，如果该数据库已经是
某个主数据库的从数据库，那么会停止和原主数据库的同步关系，转而
和新的主数据库同步

3：slaveof no one：使当前数据库停止与其他数据库的同步，转成主数据库

复制部分的配置详解

1：replicaof ：指定某一个redis作为另一个redis的从服务器，通过指定IP
和端口来设置主redis

2：masterauth：如果主redis设置了验证密码的话（使用requirepass来设置），
则在从redis的配置中要使用masterauth来设置校验密码，否则的话，主redis
会拒绝从redis的访问请求

3：replica-read-only：设置从Redis为只读

4：repl-ping-replica-period：设置从redis会向主redis发出PING包的周期，
默认是10秒

5：replica-serve-stale-data：设置当从redis失去了与主redis的连接，
或者主从同步正在进行中时，redis该如何处理外部发来的访问请求 。

如果设置为yes（默认），则从redis仍会继续响应客户端的请求。
如果设置为no，则从redis会对客户端的请求返回“SYNC with master in progress”，
当然也有例外，当客户端发来INFO请求和SLAVEOF请求，从redis还是会进行处理。

6：repl-timeout：设置主从同步的超时时间，要确保这个时限比
repl-ping-replica-period的值要大，否则每次主redis都会认为从redis超时。

7：repl-disable-tcp-nodelay：设置在主从同步时是否禁用TCP_NODELAY，
如果开启，那么主redis会使用更少的TCP包和更少的带宽来向从redis传输数据。
但是这可能会增加一些同步的延迟，大概会达到40毫秒左右。如果关闭，
那么数据同步的延迟时间会降低，但是会消耗更多的带宽。

8：repl-backlog-size：设置同步队列长度。队列长度（backlog)是主redis中的
一个缓冲区，在与从redis断开连接期间，主redis会用这个缓冲区来缓存应该发给
从redis的数据。这样的话，当从redis重新连接上之后，就不必重新全量同步数据，
只需要同步这部分增量数据即可

9：repl-backlog-ttl：设置主redis要等待的时间长度，如果主redis等了这么
长时间之后，还是无法连接到从redis，那么缓冲队列中的数据将被清理掉。
设置为0，则表示永远不清理。默认是1个小时。 

10：replica-priority：设置从redis优先级，在主redis持续工作不正常的情况，
优先级高的从redis将会升级为主redis。而编号越小，优先级越高。当优先级
被设置为0时，这个从redis将永远也不会被选中。默认的优先级为100

11：min-replicas-to-write：设置执行写操作所需的最少从服务器数量，如果
至少有这么多个从服务器， 并且这些服务器的延迟值都少于 min-replicas-max-lag 
秒， 那么主服务器就会执行客户端请求的写操作 

12：min-replicas-max-lag：设置最大连接延迟的时间， min-replicas-to-write和
min-replicas-max-lag中有一个被置为0，则这个特性将被关闭。默认情况下
min-replicas-to-write为0，而min-replicas-max-lag为10 

13： repl-diskless-sync：是否开启无盘复制，默认是no

14：repl-diskless-sync-delay：设置无盘复制延时开始秒数，默认是5秒，
意思是当PSYNC触发的时候，master延时多少秒开始向slave传送数据流，
以便等待更多的slave连接可以同时传送数据流，因为一旦PSYNC开始后，
如果有新的slave连接master，只能等待下次PSYNC。可以配置为0取消等待，立即开始

15：repl-diskless-load：是否使用无磁盘加载，这是个实验性的功能，目前
有三个选项：disabled：不要使用无磁盘加载，先将rdb文件存储到磁盘
on-empty-db：只有在完全安全的情况下才使用无磁盘加载swapdb：
解析时在RAM中保留当前DB内容的副本，直接从套接字获取数据。

复制的基本原理

1： slave启动时，会向master发送psync请求，如果这是slave重新连接master，那么master仅仅会复制给slave缺少的数据; 如果是第一次连接master，那么会触发一次全量复制

2：主数据库接到psync请求后，如果是全量复制，会在后台保存快照，就是实现RDB持久化，并将保存快照期间接收到的命令缓存起来

3：快照完成后，主数据库会将快照文件和所有缓存的命令发送给从数据库

4：从数据库接收后，会载入快照文件并执行缓存的命令，从而完成复制的初始化

5：如果是重新连接，Master会检查backlog里面的offset， master和slave都会保存一个复制的offset还有一个master id，offset是保存在backlog中的。Master只会把已经复制的offset后面的数据复制给Slave，类似断点续传。

6：在数据库使用阶段，主数据库会自动把每次收到的写命令同步到从服务器

7：Slave在复制的时候，不会阻塞Master的正常工作；也不会阻塞对自己的查询操作，它会用旧的数据集来提供服务; 但是复制完成的时候，需要删除旧数据集，加载新数据集，这个时候就会暂停对外服务了

8：强烈建议：Master一定要持久化

乐观复制策略

Redis采用乐观复制的策略，容忍在一定时间内主从数据库的内容不同，当然最终的数据会是一样的。这个策略保证了性能，在复制的时候，主数据库并不阻塞，照样处理客户端的请求。

Redis提供了配置来限制只有当数据库至少同步给指定数量的从数据库时，主数据库才可写，否则返回错误。配置是：min-replicas-to-write、min-replicas-max-lag

无硬盘复制

Master直接创建一个子进程，来生成RDB文件的内容，并通过网络直接传送给Slave，也就是RDB文件不保存到磁盘上。

以前：当复制发生时，主数据库会在后台保存RDB快照，即使你关闭了RDB，它也会这么做，这样就会导致：

1：如果主数据库关闭了RDB，现在强行生成了RDB，那么下次主数据库启动的
时候，可能会从RDB来恢复数据，这可能是旧的数据。

2：由于要生成RDB文件，如果硬盘性能不高的时候，会对性能造成一定影响
因此从2.8.18版本，引入了无硬盘复制的功能。

异步复制导致的数据丢失

在主备切换的过程中，可能会导致数据丢失。因为数据复制是异步的，可能有部分数据还没复制到slave，master就宕机了，此时这些部分数据就丢失了

脑裂导致的数据丢失

脑裂：当某个master所在机器突然脱离了集群的网络，跟其他slave机器不能连接，
但是实际上master还运行着，此时哨兵可能会认为master宕机了，然后开启选举，
将其它slave切换成了master，这个时候，集群里就会有两个master，也就是所谓的脑裂。

这种情况下可能会产生数据丢失：

1：此时虽然某个slave被切换成了master，但是客户端可能还没来得及切换到
新的master，还继续向旧master写数据，这些数据可能就丢失了

2：当旧master再次恢复的时候，会被作为一个slave挂到新的master上去，
那么旧master原来的数据就会清空，重新从新的master复制数据

解决数据丢失的方式

配置min-replicas-to-write和min-replicas-max-lag两个参数，比如：
min-replicas-to-write 1
min-replicas-max-lag 10
要求至少有1个slave，数据复制和同步的延迟不能超过10秒

如果说一旦所有的slave，数据复制和同步的延迟都超过了10秒钟，
那么这个时候，master就不会再接收任何请求了

如果出现了脑裂，一个master跟其它slave丢了连接，那么上面两个配置可以确保说，如果不能继续给指定数量的slave发送数据，而且slave超过10秒没有给自己应答消息，那么就直接拒绝客户端的写请求

后记

我会持续的把我学习Redis6.x过程的笔记记录下来，跟大家一起学习。希望能坚持下去！

码农公寓