持久化
Redis提供了2个不同形式的持久化方式。
- RDB(Redis DataBase)
- AOF(Append Of File)
什么是持久化?
持久化就是将有用的数据以某种技术保存起来,将来可以再次取出来应用。数据库技术,将内存数据以文件的形式保存在永久介质中(磁盘等)都是持久化的例子。
为什么需要持久化?
Redis对数据的操作都是基于内存的,当遇到了进程退出、服务器宕机等意外情况,如果没有持久化机制,那么Redis中的数据将会丢失无法恢复。有了持久化机制,Redis在下次重启时可以利用之前持久化的文件进行数据恢复。理解和掌握Redis的持久机制,对于Redis的日常开发和运维都有很大帮助,也是在大厂面试经常被问到的知识点。Redis支持的两种持久化机制:
RDB:把当前数据生成快照保存在硬盘上。
AOF:记录每次对数据的操作到硬盘上。
一、RDB是什么
在指定的时间间隔内将内存中的数据集快照写入磁盘,也就是行话讲的Snapshot快照,它恢复时是将快照文件直接读到内存里。
二、备份是如何执行的
Redis 会单独创建(fork)一个子进程来进行持久化,会先将数据写入到一个临时文件中,待持久化过程都结束了,再用这个临时文件昔换上次持久化好的文件。 整个过程中,主进程是不进行任何IO 操作的,这就确保了极高的性能 如果需要进行大规模数据的恢复,且对于数据恢复的完整性不是非常敏感,那RDB方式要比AOF方式更加的高效。RDB 的缺点是最后一次持久化后的数据可能丢失。
三、Fork
For的作用是复制一个与当前进程一样的进程。新进程的所有数据(变量、环境变量、程序计数器等)数值都和原进程一致,但是是一个全新的进程,并作为原进程的子进程。
在Linux程序中,fork()会产生一个和父进程完全相同的子进程,但子进程在此后多会 exec 系统调用,出于效率考虑,Linux 中引入了“写时复制技术”
一般情况父进程和子进程会共用同一段物理内存,只有进程空间的各段的内容要发生变化时,才会将父进程的内容复制一份给子进程。
四、RDB持久化流程
五、dump.rdb
在redis.conf中配置文件名称,默认为dump.rdb
六、如何触发RDB快照
stop-writes-on-bgsave-error
当Redis无法写入磁盘的话,直接关掉Redis的写操作。推荐Yes。
rdbcompression
对于存储到磁盘中的快照,可以设置是否进行压缩存储。如果是的话,redis会采用LZF算法进行压缩。
rdbchecksum
在存储快照后,还可以让redis使用CRC64算法来进行数据校验,但是这样做会增加大约10%的性能消耗,如果希望获取到最大的性能提升,可以关闭此功能。推荐Yes。
save
格式:save秒种写操作次数
RDB是整个内存的压缩过的Snapshot,RDB的数据结构,可以配置复合的快照触发条件。
默认是:
- 表示如果3600秒内至少1个key发生变化(新增、修改和删除),就触发一次重写rdb文件;
- 表示如果300秒内至少100个key发生变化(新增、修改和删除),就触发一次重写rdb文件;
- 表示如果60秒内至少10000个key发生变化(新增、修改和删除),就触发一次重写rdb文件;
周期性,每隔多少秒备份一次
save VS bgsave
save:save时只管保存,其他不管,全部阻塞。手动保存。不建议。
bgsave:Redis会在后台异步进行快照操作,快照同时还可以响应客户端请求。
可以通过lastsave命令获取最后一次成功执行快照的时间。
七、RDB优势
- 适合大规模的数据恢复
- 对数据完整性和一致性要求不高,更适合使用
- 节省磁盘空间
- 恢复速度快
八、RDB劣势
- Fork的时候,内存中的数据被克隆了一份,大致2倍的膨胀性需要考虑。
- 虽然Redis在fork时使用了“写时拷贝技术”,但是如果数据庞大时还是比较消耗性能。
- 在备份周期在一定时间间隔时间做一次备份,所以如果Redis意外down掉的话,就会丢失最后一次快照后的所有修改。
参考资源: