redis 数据备份持久化方案详解大数据

  • 使用两种备份方案

备份方案选择RDB和AOF同时进行备份,必须打开AOF的持久化机制,除非能接受在故障环境下丢失几分钟的数据。

在redis重启的时候,是优先通过AOF进行数据恢复的,因为AOF数据比较完整。

  • RDB的生成策略

要修改的是该条命令:

save 60 10000

该条命令是60秒内,如果有1万条命令执行,那么就进行快照备份。这个值略大,可以根据自己的业务量而定,可以调小至1000。但也同时意味着,在一分钟内,如果命令执

行了999条,且在最后一秒redis挂掉,该分钟内的命令将会全部丢失。

注意不要用:redis-cli SHUTDOWN 
这样的方式去测试,这是一种安全退出的模式,redis会安全生成dump.rdb

它的工作流程:

(1)redis根据配置自己尝试去生成rdb快照文件 
(2)fork一个子进程出来 
(3)子进程尝试将数据dump到临时的rdb快照文件中 
(4)完成rdb快照文件的生成之后,就替换之前的旧的快照文件dump.rdb,每次生成一个新的快照,都会覆盖之前的老快照

  • AOF的生成策略

当AOF开启之后,redis每次接收到一条写命令,就会写入日志文件中,先写入系统的 os cache中,然后隔一段时间再fsync一下。

 fsync的策略有三种:

always: 每次写入一条数据,立即将这个数据对应的写日志fsync到磁盘上去,性能非常非常差,吞吐量很低; 
     如果说确保说redis里的数据一条都不丢,那就只能这样了 everysec: 每秒将os cache中的数据fsync到磁盘,这个最常用的,生产环境一般都这么配置,性能很高,QPS还是可以上万的 no:就是直接写入os cache就不管了,让linux自带的机制去将数据刷入磁盘,这样很不可控

因此我们要配置为everysec。

 接着配置两条命令:

auto-aof-rewrite-percentage 100 auto-aof-rewrite-min-size 64mb

redis 2.4之前,还需要手动,开发一些定时任务脚本,通过BGREWRITEAOF命令去执行AOF rewrite,但是redis 2.4之后,会自动进行rewrite操作

也就是说在上一次AOF rewrite之后,日志大小是128mb,接着再往里面写日志,当总日志大小增长的比例,超过了之前的100%,即达到256mb后,就会触发rewrite操作。

注意,此时还要跟 auto-aof-rewrite-min-size 比较大小,256M 大于 64m,可以触发rewrite操作。这两条命令,可以根据业务进行调节大小,或者保持默认值

  •  定时任务备份方案(重要)

并不是说让redis自动进行持久化备份就可以的,而是要另开脚本,进行更细致的备份。

1 )每小时都copy一份rdb的备份,到一个目录中去,仅仅保留最近48小时的备份

0 * * * * sh /usr/local/redis/copy/redis_rdb_copy_hourly.sh 
 
redis_rdb_copy_hourly.sh 
 
#!/bin/sh  
 
cur_date=`date +%Y%m%d%k`       # 年月日时进行备份 
rm -rf /usr/local/redis/snapshotting/$cur_date  # 先删除原有日期底下的备份目录文件 
mkdir /usr/local/redis/snapshotting/$cur_date   # 创建该目录 
cp /var/redis/6379/dump.rdb /usr/local/redis/snapshotting/$cur_date #将快照备份 
 
del_date=`date -d -48hour +%Y%m%d%k`  # 48小时前的目录文件名 
rm -rf /usr/local/redis/snapshotting/$del_date # 删除48小时前的目录

 2 )每天copy一次备份

0 0 * * * sh /usr/local/redis/copy/redis_rdb_copy_daily.sh 
 
redis_rdb_copy_daily.sh 
 
#!/bin/sh  
 
cur_date=`date +%Y%m%d`  #年月日进行备份 
rm -rf /usr/local/redis/snapshotting/$cur_date  #先删除原有的目录 
mkdir /usr/local/redis/snapshotting/$cur_date   #创建该目录 
cp /var/redis/6379/dump.rdb /usr/local/redis/snapshotting/$cur_date  //备份cp 
 
del_date=`date -d -1month +%Y%m%d`  #仅保留近一个月的数据 
rm -rf /usr/local/redis/snapshotting/$del_date #删除

3)每天一次将所有数据上传一次到远程的云服务器上去

 原理跟第2点一样,只是不是用cp,而是用scp或rsync等命令将文件备份到远程安全服务器

 以上只给了rdb的备份,aof的备份脚本基本一致。

  •  数据恢复方案(重要)

 (1)如果是redis进程挂掉,那么重启redis进程即可,直接基于AOF日志文件恢复数据

 (2)如果是redis进程所在机器挂掉,那么重启机器后,尝试重启redis进程,尝试直接基于AOF日志文件进行数据恢复

   如果AOF没有破损,可以直接基于AOF恢复的

   AOF append-only,顺序写入,如果AOF文件破损,那么用redis-check-aof fix

 (3)如果redis当前最新的AOF和RDB文件出现了丢失/损坏,那么可以尝试基于该机器上当前的某个最新的RDB数据副本进行数据恢复

     找到RDB最新的一份备份,小时级的备份可以了,小时级的肯定是最新的,copy到redis里面去,就可以恢复到某一个小时的数据 

 (4)如果当前机器上的所有RDB文件全部损坏,那么从远程的云服务上拉取最新的RDB快照回来恢复数据

恢复的过程:

(1)优先用appendonly.aof去恢复数据

(2)停止redis,关闭aof (为什么要关闭?如果不关闭,启动redis后,redis会生成一份新的可能为空的aof强行覆盖目录下的aof,导致恢复失败)

(3)拷贝备份文件,重启redis

(4)命令行修改redis配置,开启aof (redis config set )

AOF的重写机制

随着命令不断写入AOF,文件会越来越大,为了解决这个问题,Redis引入AOF重写机制压缩文件体积。AOF文件重写是把Rdis进程内的数据转化为写命令同步到

新AOF文件的过程。

重写后的AOF文件为什么可以变小?有如下原因:

(1)进程内已经超时的数据不再写入文件。

(2)旧的AOF文件含有无效命令,如del key1、hdel key2、srem keys、set a111、set a222等。重写使用进程内数据直接生成,这样新的AOF文件只保留最终数据的写入命令。

(3)多条写命令可以合并为一个,如:lpush list a、lpush list b、lpush list c可以转化为:lpush list a b c。为了防止单条命令过大造成客户端缓冲区溢出,对于list、set、hash、zset等类型操作,以64个元素为界拆分为多条。

(4)AOF重写降低了文件占用空间,除此之外,另一个目的是:更小的AOF文件可以更快地被Redis加载。

原创文章,作者:奋斗,如若转载,请注明出处:https://blog.ytso.com/7650.html

(0)
上一篇 2021年7月18日
下一篇 2021年7月18日

相关推荐

发表回复

登录后才能评论