一、持久化
计算机的数据有两种状态:
1)持久态:如硬盘上的数据
2)瞬时态:如内存当中的数据
持久化就是将瞬时数据转换为持久数据的一个过程,但注意持久化并不意味的数据永远存在,针对不同的持久化,数据的生命周期也是不同的。比如,一次session会话中session容器中的的持久化,如果容器销毁该生命周期也就结束。
二、redis的持久化策略
redis是一个基于内存的数据库,但它也提供了持久化策略,分为两种:
1)RDB
2)AOF
redis默认采用rdb策略,你可以选择使用其中一种,也可以两种同时使用。如果两者同时使用的化,需要注意避免同时比较耗资源的I/O操作,不过一般上使用一种即可,或者使用默认策略。
RDB策略:
简单来说,它就是采用定时生成快照的方式(rdb格式文件),比如:每小时保存一次,每天保存一次。这种策略非常方便地用来做数据备份。根据你的备份数据,你可以简单的把redis还原到任何你备份的版本。
AOF策略:
AOF于RBD不同,它并不存储数据,而是将命令写入到日志当中,在系统重启的时候,通过重新执行日志中的命令构建数据。
三、RDB/AOF优缺点
RDB优点:
1)由于RDB将数据持久化,你可以在遇到问题时候轻松地恢复数据
2)RDB的持久化是通过启动一个子线程来执行I/O的,不会阻塞当前线程。
3)在redis重启的时候,如果数据较大,采用rdb方式比较快速。
RDB缺点:
1)由于定时策略,那么如果redis遇到问题,很有可能丢失最新的数据。由于RDB数据都集中在一个文件,如果文件损坏,那么数据损失几乎是灾难性的。
2)RDB会启动一个线程去持久化数据,但是如果数据量很大,那么可能会由于如超时,CPU性能不足等问题出现停止执行的情况。虽然这点上AOF也是启动一个线程去处理,但是你可以调整日志的写入频率来缓解这种问题。
AOF优点:
1)AOF策略相对更加的耐用,你可以配置不同的持久化形式比如:每秒一次、每次key变化、或完全不持久化。其实即使每秒一次,它的性能也是很不错的,并且你最多只会丢失一秒钟的数据。
2)AOF是采用附加到日志的方式,所以它不会出现如断电导致数据损坏的情况。即使在写入日志的过程中断电,也可以轻易地通过redis-check-aof工具来解决。
3)如果日志文件越来越大,redis会自动生成新的文件,然后切换并写入到新的文件当中。
4)日志文件的格式是非常简单易懂的,你甚至可以停止redis更改日志中的命令,然后再重新启动。
AOF的缺点:
1)相同的数据集,AOF所占用的空间明显大于RDB文件。
2)AOF写入频繁,I/O的频率对于RDB来说更高,性能上自然会略低。
3)有一些特定的命令会导致AOF出现问题,当然redis不断的迭代会相应的解决一些问题。但RDB明显不会出现这些问题。
四、如何使用
1)快照
你可以在redis.conf配置快照的生成策略,如:
save 60 1000
60秒如果有1000个key发生变化。如果要关闭快照,可以注释掉该配置
RDB执行过程:启动一个子线程去生成RDB临时文件,这个临时文件生成完毕以后会替换旧的文件。
2)Append-only file
你只需要在redis.conf中将它开启即可(修改为yes)
appendonly yes
你也可以配置日志写入频率:
1)always 每当有变化
2) seconds 每秒钟
3) no 不写入
AOF执行过程:子线程去重写一个临时文件,当重写完毕,父线程会把缓冲区的新命令写入到临时文件的尾巴,然后替换旧的文件。(这里注意,在子线程重写的过程中,父线程会将新命令写入缓冲区、也会写入旧文件,这样即使子线程重写失败,旧文件依然完整)
五、备份恢复
无论采用RDB策略还是AOF策略,最终都会生成文件本地文件,而备份和恢复其实就是将完整的本地文件进行备份,通过加载备份文件来恢复数据。