Redis的RDB和AOF

2022-08-23 20:38:51

1.数据快照RDB

1.1原理

(1)RDB是将某一时刻的数据持久化到磁盘中，是一种快照的方式。

(2)redis在进行数据持久化的过程中，会先将数据写入到一个临时文件中，待持久化过程都结束了，才会用这个临时文件替换上次持久化好的文件。正是这种特性，让我们可以随时来进行备份，及时redis处于运行状态；

(3)对于RDB方式，redis会单独创建（fork）一个子进程来进行持久化，而主进程是不会进行任何IO操作的，这样就确保了redis极高的性能。

(4)如果需要进行大规模数据的恢复，且对于数据恢复的完整性不是非常敏感，那RDB方式要比AOF方式更加的高效。

如果你对数据的完整性非常敏感，那么RDB方式就不太适合你，因为即使你每5分钟都持久化一次，当redis故障时，仍然会有近5分钟的数据丢失。所以，redis还提供了另一种持久化方式，那就是AOF。

1.2生成快照的几种方法

手动触发：

(1)save命令用于创建当前数据库的备份，该命令将在 redis 安装目录dir下创建dump.rdb文件;

如果需要恢复数据，只需将备份文件dump.rdb移动到 redis 安装目录并启动服务即可。获取redis目录可以使用 config get dir命令

(2) bgsave在后台执行;

(3)shutdown save，关闭服务的时候，shutdown有两个选项，nosave|save，如果不加，默认是save;

自动触发：

(4)配置文件redis.conf中的设置:

save 900 1

save 300 10

save 60 10000

dbfilename dump.rdb

1.3 使用rdb文件进行还原测试

注意：还原的时候需要关闭aof的功能，否则redis在启动的时候会加载appendonly.aof这个日志文件，这样恢复的就不是dump.rdb的内容了，而是应用的aof日志

#使用redis-benchmark加载测试数据,并关闭aof:

src/redis-benchmark -h 127.0.0.1 -p 6379 -n 200000 -c 20 -d 4 -k 1 --csv > redis_benchmart_$(date +%Y%m%d).log 2>&1

[root@sht-sgmhadoopcm-01 redis]# src/redis-cli

127.0.0.1:6379> config get dir

1) "dir"

2) "/usr/local/redis"

127.0.0.1:6379> config get appendonly

1) "appendonly"

2) "no"

127.0.0.1:6379> keys *

1) "key1"

2) "key2"

3) "key:__rand_int__"

4) "mylist"

5) "counter:__rand_int__"

127.0.0.1:6379> shutdown save

[root@sht-sgmhadoopcm-01 redis]# mv dump.rdb dump.rdb.bak

[root@sht-sgmhadoopcm-01 redis]# src/redis-server redis.conf

[root@sht-sgmhadoopcm-01 redis]# src/redis-cli

127.0.0.1:6379> keys *

(empty list or set)

127.0.0.1:6379> shutdown nosave

把备份的rdb文件放在指定位置，并重启redis，这样数据又恢复了

[root@sht-sgmhadoopcm-01 redis]# mv dump.rdb.bak dump.rdb

[root@sht-sgmhadoopcm-01 redis]# src/redis-server redis.conf

[root@sht-sgmhadoopcm-01 redis]# src/redis-cli

127.0.0.1:6379> keys *

1) "key:__rand_int__"

2) "mylist"

3) "key2"

4) "key1"

5) "counter:__rand_int__"

2.AOF(append only file)

2.1 AOF

(1)即只允许追加，不允许更改的文件

开启方法：appendonly yes

AOF方式是将执行过的写指令记录下来，在数据恢复时按照从前到后的顺序再将指令都执行一遍；

同样数据集的情况下，AOF文件要比RDB文件的体积大。而且，AOF方式的恢复速度也要慢于RDB方式。

我们通过配置redis.conf中的appendonly yes就可以打开AOF功能。如果有写操作（如SET等），redis就会被追加到AOF文件的末尾。

默认的AOF持久化策略是每秒钟fsync一次（fsync是指把缓存中的写指令记录到磁盘中），因为在这种情况下，redis仍然可以保持很好的处理性能，即使redis故障，也只会丢失最近1秒钟的数据。

(2)如果在追加日志时，恰好遇到磁盘空间满、inode满或断电等情况导致日志写入不完整，redis提供了redis-check-aof工具，可以用来进行日志修复:

Make a backup copy of your AOF file.
Fix the original file using the redis-check-aof tool that ships with Redis: $ redis-check-aof --fix appendonly.aof
Optionally use diff -u to check what is the difference between two files.
Restart the server with the fixed file.

(3)通过appendonly.aof文件进行还原测试

127.0.0.1:6379> config get appendonly

1) "appendonly"

2) "yes"

127.0.0.1:6379> mset key1 1 key2 2 key3 3

127.0.0.1:6379> keys *

1) "key3"

2) "key1"

3) "key2"

[root@sht-sgmhadoopcm-01 redis]# cp appendonly.aof appendonly.aof.bak

127.0.0.1:6379> flushall

127.0.0.1:6379> keys *

(empty list or set)

127.0.0.1:6379> shutdown

[root@sht-sgmhadoopcm-01 redis]# rm -rf appendonly.aof

[root@sht-sgmhadoopcm-01 redis]# mv appendonly.aof.bak appendonly.aof

[root@sht-sgmhadoopcm-01 redis]# src/redis-server redis.conf

[root@sht-sgmhadoopcm-01 redis]# src/redis-cli

127.0.0.1:6379> keys *

1) "key1"

2) "key2"

3) "key3"

2.2 aof文件的rewrite

(1)rewrite原理

因为采用了追加方式，如果不做任何处理的话，AOF文件会变得越来越大，为此，redis提供了AOF文件重写（rewrite）机制，即当AOF文件的大小超过所设定的阈值时，redis就会启动AOF文件的内容压缩，只保留可以恢复数据的最小指令集。假如我们调用了100次INCR指令，在AOF文件中就要存储100条指令，但这明显是很低效的，完全可以把这100条指令合并成一条SET指令，这就是重写机制的原理。

在进行AOF重写时，仍然是采用先写临时文件，全部完成后再替换的流程，所以断电、磁盘满等问题都不会影响AOF文件的可用性。

AOF方式的另一个好处，我们通过一个“场景再现”来说明。某同学在操作redis时，不小心执行了flushall，导致redis内存中的数据全部被清空了，只要redis配置了AOF持久化方式，且AOF文件还没有被重写（rewrite），我们就可以用最快的速度暂停redis并编辑AOF文件，将最后一行的FLUSHALL命令删除，然后重启redis，就可以恢复redis的所有数据到FLUSHALL之前的状态了。但是如果AOF文件已经被重写了，那就无法通过这种方法来恢复数据了。

(2)触发rewrite的方法

第一种方法：使用bgrewriteaof命令手动触发;

第二种方法：由配置文件控制

auto-aof-rewrite-percentage 100

auto-aof-rewrite-min-size 64mb

比如上边的参数设置的含义：当appendonly.aof为小于64M时，不会触发rewrite，当文件大64M,增长率达到100%,即为128M时，触发一次rewrite,这个时候redis记住文件rewrite之后的大小，假如为80M,只有等到文件再次涨到160M后，才会触发下一次，依次类推

3 总结：

官方推荐同时开启这两种备份策略，确保数据更加安全；

如果你的业务可以接受一定数据的丢失，更注重性能，可以只开启RDB;

如果只把redis作为一个缓存来用，则不需要开启RDB和AOF;

参考链接

https://redis.io/topics/persistence

码农公寓

相关文章