百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术教程 > 正文

Mongodb和数据库的双写一致性,与Redis区别这么大?

mhr18 2024-12-04 13:37 12 浏览 0 评论

前言

最近在我的技术群里,有位小伙伴问了大家一个问题:如何保证Mongodb和数据库双写的数据一致性?

群友们针对这个技术点讨论的内容,引起了我的兴趣。

其实我在实际工作中的有些业务场景,也在使用Mongodb,也遇到过双写的数据一致性问题。

今天跟大家一起分享一下,这类问题的解决办法,希望对你会有所帮助。

1 常见误区

很多小伙伴看到双写数据一致性问题,首先会想到的是Redis数据库的数据双写一致性问题。

有些小伙伴认为,Redis数据库的数据双写一致性问题,跟Mongodb数据库的数据双写一致性问题,是同一个问题。

但如果你仔细想想它们的使用场景,就会发现有一些差异。

1.1 我们是如何用缓存的?

Redis缓存能提升我们系统的性能。

一般情况下,如果有用户请求过来,先查缓存,如果缓存中存在数据,则直接返回。如果缓存中不存在,则再查数据库,如果数据库中存在,则将数据放入缓存,然后返回。如果数据库中也不存在,则直接返回失败。

流程图如下:

有了缓存之后,能够减轻数据库的压力,提升系统性能。

通常情况下,保证缓存和数据双写数据一致性,最常用的技术方案是:延迟双删

1.2 我们是如何用MongoDB的?

MongoDB是一个高可用、分布式的文档数据库,用于大容量数据存储。文档存储一般用类似json的格式存储,存储的内容是文档型的。

通常情况下,我们用来存储大数据或者json格式的数据。

用户写数据的请求,核心数据会被写入数据库,json格式的非核心数据,可能会写入MongoDB。

流程图如下:

此外,在数据库的表中,保存了MongoDB相关文档的id。

用户读数据的请求,会先读数据库中的数据,然后通过文档的id,读取MongoDB中的数据。

流程图如下:

这样可以保证核心属性不会丢失,同时存储用户传入的较大的数据,两全其美。

Redis和MongoDB在我们实际工作中的用途不一样,导致了它们双写数据一致性问题的解决方案是不一样的。

接下来我们一起看看,如何保证MongoDB和数据库的双写的数据一致性?

2 如何保证双写一致性?

目前双写MongoDB和数据库的数据,用的最多的就是下面这两种方案。

2.1 先写数据库,再写MongoDB

该方案最简单,先在数据库中写入核心数据,再在MongoDB中写入非核心数据。

流程图如下:

如果有些业务场景,对数据的完整性要求不高,即非核心数据可有可无,使用该方案也是可以的。

但如果有些业务场景,对数据完整性要求比较高,用这套方案可能会有问题。

当数据库刚保存了核心数据,此时网络出现异常,程序保存MongoDB的非核心数据时失败了。

但MongoDB并没有抛出异常,数据库中已经保存的数据没法回滚,这样会出现数据库中保存了数据,而MongoDB中没保存数据的情况,从而导致MongoDB中的非核心数据丢失的问题。

所以这套方案,在实际工作中使用不多。

2.2 先写MongoDB,再写数据库

在该方案中,先在MongoDB中写入非核心数据,再在数据库中写入核心数据。

流程图如下:

关键问题来了:如果MongoDB中非核心数据写入成功了,但数据库中的核心数据写入失败了怎么办?

这时候MongoDB中非核心数据不会回滚,可能存在MongoDB中保存了数据,而数据库中没保存数据的问题,同样会出现数据不一致的问题。

答:我们忘了一个前提,查询MongoDB文档中的数据,必须通过数据库的表中保存的mongo id。但如果这个mongo id在数据库中都没有保存成功,那么,在MongoDB文档中的数据是永远都查询不到的。

也就是说,这种情况下MongoDB文档中保存的是垃圾数据,但对实际业务并没有影响。

这套方案可以解决双写数据一致性问题,但它同时也带来了两个新问题:

  1. 用户修改操作如何保存数据?
  2. 如何清理垃圾数据?

3 用户修改操作如何保存数据?

我之前聊的先写MongoDB,再写数据库,这套方案中的流程图,其实主要说的是新增数据的场景。

但如果在用户修改数据的操作中,用户先修改MongoDB文档中的数据,再修改数据库表中的数据。

流程图如下:如果出现MongoDB文档中的数据修改成功了,但数据库表中的数据修改失败了,不也出现问题了?

那么,用户修改操作时如何保存数据呢?

这就需要把流程调整一下,在修改MongoDB文档时,还是新增一条数据,不直接修改,生成一个新的mongo id。然后在修改数据库表中的数据时,同时更新mongo id字段为这个新值。

流程图如下:这样如果新增MongoDB文档中的数据成功了,但修改数据库表中的数据失败了,也没有关系,因为数据库中老的数据,保存的是老的mongo id。通过该id,依然能从MongoDB文档中查询出数据。

使用该方案能够解决修改数据时,数据一致性问题,但同样会存在垃圾数据。

其实这个垃圾数据是可以即使删除的,具体流程图如下:

在之前的流程中,修改完数据库,更新了mongo id为新值,接下来,就把MongoDB文档中的那条老数据直接删了。

该方案可以解决用户修改操作中,99%的的垃圾数据,但还有那1%的情况,即如果最后删除失败该怎么办?

答:这就需要加重试机制了。

我们可以使用job或者mq进行重试,优先推荐使用mq增加重试功能。特别是想RocketMQ,自带了失败重试机制,有专门的重试队列,我们可以设置重试次数

流程图优化如下:

将之前删除MongoDB文档中的数据操作,改成发送mq消息,有个专门的mq消费者,负责删除数据工作,可以做成共用的功能。它包含了失败重试机制,如果删除5次还是失败,则会把该消息保存到死信队列中。

然后专门有个程序监控死信队列中的数据,如果发现有数据,则发报警邮件

这样基本可以解决修改删除垃圾数据失败的问题。

4 如何清理新增的垃圾数据?

还有一种垃圾数据还没处理,即在用户新增数据时,如果写入MongoDB文档成功了,但写入数据库表失败了。由于MongoDB不会回滚数据,这时候MongoDB文档就保存了垃圾数据,那么这种数据该如何清理呢?

4.1 定时删除

我们可以使用job定时扫描,比如:每天扫描一次MongoDB文档,将mongo id取出来,到数据库查询数据,如果能查出数据,则保留MongoDB文档中的数据。

如果在数据库中该mongo id不存在,则删除MongoDB文档中的数据。

如果MongoDB文档中的数据量不多,是可以这样处理的。但如果数据量太大,这样处理会有性能问题。

这就需要做优化,常见的做法是:缩小扫描数据的范围

比如:扫描MongoDB文档数据时,根据创建时间,只查最近24小时的数据,查出来之后,用mongo id去数据库查询数据。

如果直接查最近24小时的数据,会有问题,会把刚写入MongoDB文档,但还没来得及写入数据库的数据也查出来,这种数据可能会被误删。

可以把时间再整体提前一小时,例如:

in_time < 当前时间-1 and in_time >= 当前时间-25

获取25小时前到1小时前的数据。

这样可以解决大部分系统中,因为数据量过多,在一个定时任务的执行周期内,job处理不完的问题。

但如果根据时间缩小范围之后,数据量还是太大,job还是处理不完该怎么办?

答:我们可以在job用多线程删除数据。

当然我们还可以将job的执行时间缩短,根据实际情况而定,比如每隔12小时,查询创建时间是13小时前到1小时前的数据。

或者每隔6小时,查询创建时间是7小时前到1小时前的数据。

或者每隔1小时,查询创建时间是2小时前到1小时前的数据等等。

4.2 随机删除

其实删除垃圾数据还有另外一种思路。

不知道你了解过Redis删除数据的策略吗?它在处理大批量数据时,为了防止使用过多的CPU资源,用了一种随机删除的策略。

我们在这里可以借鉴一下。

有另外一个job,每隔500ms随机获取10条数据进行批量处理,当然获取的数据也是根据时间缩小范围的。


原文链接:https://mp.weixin.qq.com/s/Ros08QyrwyIXjc15-VEO_w

相关推荐

redis 7.4.3更新!安全修复+性能优化全解析

一、Redis是什么?为什么选择它?Redis(RemoteDictionaryServer)是一款开源的高性能内存键值数据库,支持持久化、多数据结构(如字符串、哈希、列表等),广泛应用于缓存、消...

C# 读写Redis数据库的简单例子

CSRedis是一个基于C#的Redis客户端库,它提供了与Redis服务器进行交互的功能。它是一个轻量级、高性能的库,易于使用和集成到C#应用程序中。您可以使用NuGet包管理器或使用以下命令行命令...

十年之重修Redis原理

弱小和无知并不是生存的障碍,傲慢才是。--------面试者总结Redis可能都用过,但是从来没有理解过,就像一个熟悉的陌生人,本文主要讲述了Redis基本类型的使用、数据结构、持久化、单线程模型...

高频L2行情数据Redis存储架构设计(含C++实现代码)

一、Redis核心设计原则内存高效:优化数据结构,减少内存占用低延迟访问:单次操作≤0.1ms响应时间数据完整性:完整存储所有L2字段实时订阅:支持多客户端实时数据推送持久化策略:RDB+AOF保障数...

Magic-Boot开源引擎:零代码玩转企业级开发,效率暴涨!

一、项目介绍基于magic-api搭建的快速开发平台,前端采用Vue3+naive-ui最新版本搭建,依赖较少,运行速度快。对常用组件进行封装。利用Vue3的@vue/compiler-sfc单文...

项目不行简历拉胯?3招教你从面试陪跑逆袭大厂offer!

项目不行简历拉胯?3招教你从面试陪跑逆袭大厂offer!老铁们!是不是每次面试完都感觉自己像被大厂面试官婉拒的渣男?明明刷了三个月题库,背熟八股文,结果一被问项目就支支吾吾,简历写得像大学生课程设计?...

谷歌云平台:开发者部署超120个开源包

从国外相关报道了解,Google与Bitnami合作为Google云平台增加了一个新的功能,为了方便开发人员快捷部署程序,提供了120余款开源应用程序云平台的支持。这些应用程序其中包括了WordPre...

知名互联网公司和程序员都看好的数据库是什么?

2017年数据库领域的最大趋势是什么?什么是最热的数据处理技术?学什么数据库最有前途?程序员们普遍不喜欢的数据库是什么?本文都会一一揭秘。大数据时代,数据库的选择备受关注,此前本号就曾揭秘国内知名互联...

腾讯云发布云存储MongoDB服务

近日,著名安全专家兼Shodan搜索引擎的创建者JohnMatherly发现,目前至少有35000个受影响的MongoDB数据库暴露在互联网上,它们所包含的数据暴露在网络攻击风险之中。据估计,将近6...

已跪,Java全能笔记爆火,分布式/开源框架/微服务/性能调优全有

前言程序员,立之根本还是技术,一个程序员的好坏,虽然不能完全用技术强弱来判断,但是技术水平一定是基础,技术差的程序员只能CRUD,技术不深的程序员也成不了架构师。程序员对于技术的掌握,除了从了解-熟悉...

面试官:举个你解决冲突的例子?别怂!用这个套路……

面试官:举个你解决冲突的例子?别怂!用这个套路……最近收到粉丝私信,说被问到:团队技术方案有分歧怎么办?当场大脑宕机……兄弟!这不是送命题,是展示你情商+技术判断力的王炸题!今天教你们3招,用真实案例...

面试碰到MongoDB?莫慌,跟面试官这样吹MongoDB 复制集

推荐阅读:吊打MySQL:21性能优化实践+学习导图+55面试+笔记+20高频知识点阿里一线架构师分享的技术图谱,进阶加薪全靠它十面字节跳动,依旧空手而归,我该放弃吗?文末会分享一些MongoDB的学...

SpringBoot集成扩展-访问NoSQL数据库之Redis和MongoDB!

与关系型数据库一样,SpringBoot也提供了对NoSQL数据库的集成扩展,如对Redis和MongoDB等数据库的操作。通过默认配置即可使用RedisTemplate和MongoTemplate...

Java程序员找工作总卡项目关?

Java程序员找工作总卡项目关?3招教你用真实经历写出HR抢着要的简历!各位Java老哥,最近刷招聘软件是不是手都划酸了?简历投出去石沉大海,面试邀请却总在飞别人的简历?上周有个兄弟,13年经验投了5...

Java多租户SaaS系统实现方案

嗯,用户问的是Java通过租户id实现的SaaS方案。首先,我需要理解用户的需求。SaaS,也就是软件即服务,通常是指多租户的架构,每个租户的数据需要隔离。用户可能想知道如何在Java中利用租户ID来...

取消回复欢迎 发表评论: