Redis 持久化AOF你真的了解吗?阿里码农10分钟让你彻底搞懂
mhr18 2024-11-16 23:25 19 浏览 0 评论
大家都知道,redis相比其他cache而言,它是支持持久化的,这样就多了一份保障,在down机之后,可以从持久化文件中进行恢复,防止从后端数据库重新加载,而给数据库造成压力。redis 支持两种持久化的方式:一种是 AOF ,一种是RDB。今天主要来聊聊AOF持久化的方式。
写入日志时机
redis 在写AOF日志的时候,是先执行redis命令,执行redis 命令之后,才会写入AOF日志。这样做的好处,是防止错误的命令写入AOF日志,同时还会省去redis 命令语法检查的开销,同时这样不会阻塞redis线程进行写操作。
流程如下:
日志内容
大家看了上图,其实就知道AOF日志文件存的是什么,其实就是存储的文本格式的命令,以set hi redis 为例,*3 表示由三部分( set hi redis )组成,$3表示 这个部分由三个字节组成,也就是set ,其他 hi redis 都是一个道理这里就不多做解析,如果有疑问欢迎大家留言提问。
日志的写到磁盘的策略
我们知道reids 的aof 日志,最后肯定是要落盘的,写入磁盘肯定就会受到磁盘io的影响,如果磁盘io很忙,那么势必会影响我们写入磁盘的速度,而且写入磁盘和写入内存的速度肯定不是一级别的,会不会影响redis 线程进行返回结果呢,因为我上篇文章介绍了 redis单线程模型 ,也就是阻塞了redis 的主线程呢,这样就增加了延迟,后续的操作就会排队或者超时。
其实redis 为我们提供三种写磁盘的策略,分别为Always、EverySecond、No,下面分别介绍这三种策略原理和优缺点。
Aways
所谓的always 就是执行redis 写命令之后,立即执行写回磁盘,写入磁盘之后,才会返回结果,这两部是同步进行,势必会增加redis 的响应延迟,如果此时磁盘io很繁忙,那么写如磁盘就会慢,那么redis 就会增加延迟时间。
看下图:
1-3 步骤是顺序执行,且同步执行的。
现在可以思考下,这种模式会不会丢失数据呢? 看下图:
图中黑色圆表示断电了,拔出电线。
在执行第二步之前,断电了。
答案 是会的,如果写入内存成功后,然后同步执行写回磁盘操作,这两个步骤中,在执行写磁盘的之前,断电了,那么此时这条命令的数据是没有写入磁盘,也就是没有持久化成功,redis 再启动恢复的时候,aof日志中是没有这条记录的。
EverySecond
所谓EverySecond 这个词很好理解,就是每秒写入磁盘一次。
说下具体的流程吧,其实就是redis 写入内存成功后,并不是同步写入磁盘了,而是会写入aof日志的缓冲区,也就是一块内存,那么写入的速度会很快。然后redis 后台会有一个线程专门读取aof日志缓冲区的命令,再写入磁盘。
看图说话:
现在思考下,这种模式,会不会丢失数据呢?
看图说话:
图中黑色圆表示断电了,拔出电线。
答案是肯定的啊,因为reids 写入内存之后,会把命令写入缓冲区,缓冲区说白了 ,也是内存,后台线程每秒读取一次,写入磁盘,那么如果发生断电呢,那么缓冲区内的数据,也就是上一秒的数据,还没来得及写入磁盘就丢失了。
No
和EverySecond 类似,redis 写入内存成功之后,redis 的写命令也是会写入到aof 缓冲区,只是此时不会由redis 后台线程去执行写入磁盘的操作了,而是有操作系统来决定,何时刷新到磁盘。
看图说话:
丢不丢数据,就很好看出来了,丢多少,也由操作系统来决定了,这里不多做说明了
三种策略的对比
至于怎么选择这三种策略,看自己的实际需求,数据要求的敏感度,允不允许丢失,来做一个性能和需求的取舍。
AOF日志文件的重写
随着redis 命令的增多,那么aof日志文件,肯定是约来越大的,那么大文件在进行文件写入的时候,速度就会变慢,而且操作系统会对大文件的保存会做限制,无法保存文件。redis 再进行重启数据恢复的时候,是逐一执行aof日志的命令,如果文件很大,那么数据恢复的过程就会很慢,造成的影响可想而知。
那么此时就会进行aof日志文件的重写操作,那么重写过程中都干了什么呢?是在原有的aof日志文件内的命令进行重写吗?aof 重写过程中哪些操作会阻塞redis 线程的读写操作的延迟呢?
怎么就变大了?
变大的原因,其实也是很简答了,命令约来越多,当然就变大了,其次对一个key 的多次操作,就会造成一个aof文件日志存储了一个key 的多次操作,如果操作很频繁的话,那么日志文件增大的速度可想而知了。其实redis 在重写的过程中,就是把一个key 的多次操作命令进行压缩,压缩为一条写入命令,这样aof 文件就变小了,小的aof文件无论再写入和恢复数据的时候都会很快的。
看图说话:
一开始对set 集合 login_user 进行了多次操作,但是在重写之后就压缩为了一条命令。
重写过程
aof 的重写,并不会是redis 主线程来完成的,redis会fork出一个子进程进行 aof 日志的重写,这个子进程交bgrewriteaof。
redis 在进行aof 重写的过程中,并不是对原有的aof文件进行分析重写,而是会copy一份redis当前的内存页表给子进程,这也是fork子进程的过程,如果redis的内存很大,那么内存页表就会很大,那么copy的过程就会变慢,记住这个copy的过程是会阻塞redis 的主线程的。
copy完成之后,此时redis 主线程和 fork子进程就会指向相同的内存地址,那么子进程就可以开始读取内存地址的数据,来生成新的aof日志了。
那么此时可能还会有的新的请求过来,新的请求redis 必须要处理的,不能收到aof重写的影响,此时会用到linux 的copyonwrite技术,也叫写时复制,也就是说当修改一个已经存在的key的时候,此时会复制这个key所在的内存页到新的地址,复制完成后,再进行修改key的操作,如果页很大,这个过程就会阻塞redis 主线程,延迟就会增加,这是需要注意的地方。对于新进来的请求,redis 会把新命令存储aof日志重新缓冲区,当子进程重写完成之后,就会读取aof日志重新缓冲区的内容追加到新的aof日志中,此时aof重写完成,旧的aof日志就会被替换。
注意在aof重写的过程中,新的写请求过来,还是会往原来的aof日志中写入的,主要是为了防止aof重写失败,而不会影响旧aof日志数据的丢失。
继续看图说话:
总结
今天聊了aof日志持久化的方式,文件内容是什么,以及写入磁盘的三种策略,每种策略的对redis的性能和数据可靠性都有影响,Aways、EverySecond、No 性能逐次提高,可靠性逐渐降低,具体使用要看自己对数据的实际需求。
还有就是aof 重写,fork子进程是会阻塞redis 操作线程的,copyonwrite 如果遇到大页 也会增加阻塞redis 操作线程的时间。
aof 重写触发时机:
手动发送“bgrewriteaof”指令,通过子进程生成更小体积的aof,然后替换掉旧的、大体量的aof文件。
配置文件配置自动触发: auto-aof-rewrite-percentage 100
auto-aof-rewrite-min-size 64mb
在aof文件体量超过64mb,且比上次重写后的体量增加了100%时自动触发重写。
根据自己的需求来修改配置即可。
如果文章对你有帮助的话,就点赞支持一波吧,非常感谢!
如何获取Java学习资料?
转发分享此文,后台私信小编:“ 666 ”即可获取。(注:转发分享,感谢大家)
相关推荐
- 如何检查 Linux 服务器是物理服务器还是虚拟服务器?
-
在企业级运维、故障排查和性能调优过程中,准确了解服务器的运行环境至关重要。无论是物理机还是虚拟机,都存在各自的优势与限制。在很多场景下,尤其是当你继承一台服务器而不清楚底层硬件细节时,如何快速辨识它是...
- 第四节 Windows 系统 Docker 安装全指南
-
一、Docker在Windows上的运行原理(一)架构限制说明Docker本质上依赖Linux内核特性(如Namespaces、Cgroups等),因此在Windows系统上无法直...
- C++ std:shared_ptr自定义allocator引入内存池
-
当C++项目里做了大量的动态内存分配与释放,可能会导致内存碎片,使系统性能降低。当动态内存分配的开销变得不容忽视时,一种解决办法是一次从操作系统分配一块大的静态内存作为内存池进行手动管理,堆对象内存分...
- Activiti 8.0.0 发布,业务流程管理与工作流系统
-
Activiti8.0.0现已发布。Activiti是一个业务流程管理(BPM)和工作流系统,适用于开发人员和系统管理员。其核心是超快速、稳定的BPMN2流程引擎。Activiti可以...
- MyBatis动态SQL的5种高级玩法,90%的人只用过3种
-
MyBatis动态SQL在日常开发中频繁使用,但大多数开发者仅掌握基础标签。本文将介绍五种高阶技巧,助你解锁更灵活的SQL控制能力。一、智能修剪(Trim标签)应用场景:动态处理字段更新,替代<...
- Springboot数据访问(整合Mybatis Plus)
-
Springboot整合MybatisPlus1、创建数据表2、引入maven依赖mybatis-plus-boot-starter主要引入这个依赖,其他相关的依赖在这里就不写了。3、项目结构目录h...
- 盘点金州勇士在奥克兰13年的13大球星 满满的全是...
-
见证了两个月前勇士与猛龙那个史诗般的系列赛后,甲骨文球馆正式成为了历史。那个大大的红色标志被一个字母一个字母地移除,在周四,一切都成为了过去式。然而这座,别名为“Roaracle”(译注:Roar怒吼...
- Mybatis入门看这一篇就够了(mybatis快速入门)
-
什么是MyBatisMyBatis本是apache的一个开源项目iBatis,2010年这个项目由apachesoftwarefoundation迁移到了googlecode,并且改名为M...
- Springboot数据访问(整合druid数据源)
-
Springboot整合druid数据源基本概念SpringBoot默认的数据源是:2.0之前:org.apache.tomcat.jdbc.pool.DataSource2.0及之后:com.z...
- Linux 中的 "/etc/profile.d" 目录有什么作用 ?
-
什么是/etc/profile.d/目录?/etc/profile.d/目录是Linux系统不可或缺的一部分保留配置脚本。它与/etc/profile文件相关联,这是一个启动脚本,该脚...
- 企业数据库安全管理规范(企业数据库安全管理规范最新版)
-
1.目的为规范数据库系统安全使用活动,降低因使用不当而带来的安全风险,保障数据库系统及相关应用系统的安全,特制定本数据库安全管理规范。2.适用范围本规范中所定义的数据管理内容,特指存放在信息系统数据库...
- Oracle 伪列!这些隐藏用法你都知道吗?
-
在Oracle数据库中,有几位特殊的“成员”——伪列,它们虽然不是表中真实存在的物理列,但却能在数据查询、处理过程中发挥出意想不到的强大作用。今天给大家分享Oracle伪列的使用技巧,无论...
- Oracle 高效处理数据的隐藏神器:临时表妙用
-
各位数据库搬砖人,在Oracle的代码世界里闯荡,处理复杂业务时,是不是总被数据“搅得头大”?今天给大家安利一个超实用的隐藏神器——临时表!当你需要临时存储中间计算结果,又不想污染正式数据表...
- Oracle 数据库查询:多表查询(oracle多表关联查询)
-
一、多表查询基础1.JOIN操作-INNERJOIN:返回两个表中满足连接条件的匹配行,不保留未匹配数据。SELECTa.emp_id,b.dept_nameFROMempl...
- 一文掌握怎么利用Shell+Python实现多数据源的异地备份程序
-
简介:在信息化时代,数据安全和业务连续性已成为企业和个人用户关注的焦点。无论是网站数据、数据库、日志文件,还是用户上传的文档、图片等,数据一旦丢失,损失难以估量。尤其是当数据分布在多个不同的目录、服务...
你 发表评论:
欢迎- 一周热门
- 最近发表
-
- 如何检查 Linux 服务器是物理服务器还是虚拟服务器?
- 第四节 Windows 系统 Docker 安装全指南
- C++ std:shared_ptr自定义allocator引入内存池
- Activiti 8.0.0 发布,业务流程管理与工作流系统
- MyBatis动态SQL的5种高级玩法,90%的人只用过3种
- Springboot数据访问(整合Mybatis Plus)
- 盘点金州勇士在奥克兰13年的13大球星 满满的全是...
- Mybatis入门看这一篇就够了(mybatis快速入门)
- Springboot数据访问(整合druid数据源)
- Linux 中的 "/etc/profile.d" 目录有什么作用 ?
- 标签列表
-
- oracle位图索引 (74)
- oracle基目录 (50)
- oracle批量插入数据 (65)
- oracle事务隔离级别 (53)
- oracle主从同步 (55)
- oracle 乐观锁 (51)
- redis 命令 (78)
- php redis (88)
- redis 存储 (66)
- redis 锁 (69)
- 启动 redis (66)
- redis 时间 (56)
- redis 删除 (67)
- redis内存 (57)
- redis并发 (52)
- redis 主从 (69)
- redis 订阅 (51)
- redis 登录 (54)
- redis 面试 (58)
- 阿里 redis (59)
- redis 搭建 (53)
- redis的缓存 (55)
- lua redis (58)
- redis 连接池 (61)
- redis 限流 (51)