百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术教程 > 正文

批处理相关技术在支付业务系统中的应用

mhr18 2024-12-24 12:24 18 浏览 0 评论

批处理相关技术在支付业务系统中的应用

对于任何未明、处理中的订单,作为异步系统,都需要进行补偿处理
而实现补偿处理最传统的方式就是跑批处理。大部分情况下,批处理任务会被安排,并在预先设定好的事件间隔来执行。例如:一年、一个月、一天的特定时间。大部分情况下,批处理的输出数据和输入数据都是有边界数据。为了处理不同量级的数据,可以从不同角度可以分成不同的各类,按批处理系统可以分为单道批处理系统和多道批处理系统。按应用支持角度划分,可以分为单应用系统、分布式应用系统;按状态持久化角度可以分为基于内存系统、基于中间件系统、基于数据库系统等。在实时处理数据量超过上万次的支付系统中我们使用了以下几种技术来应对该场景。

分片技术的应用

业务迅速发展带来了跑批数据量的急剧增加。单机处理跑批数据已不能满足需要,另考虑到企业处理数据的扩展能力,多机跑批势在必行。多机跑批是指将跑批任务分发到多台服务器上执行,多机跑批的前提是“数据分片”。

分片的维度通常有状态(state)、类型(accountType)、id分区等,需要按照业务匹配选取。具体的分片方法有以下几种:

1、数据库层面,对业务主键进行取模

where mod(id, 4) in (1, 2)

这种方式的问题是,在主键或者索引字段外套了一个函数,索引失效、全表扫描。改进方案是查询条件中再增加一个索引字段。

where mod(id, 4) in (1, 2) and create_date > sysdate - 1

  1. 数据库层面,增加字段,在生成数据时,就为该行数据生成一个mod值

做分片的初衷就是跑批数据量越来越大、单台机器处理能力有限,通过扩展机器数来提升系统处理的能力。该mod值建议不要太小,至少要比分片项大。例如,生成的1000条数据的mod值只有0和1,而机器数加到了10,那最终只有两台机器在运行,造成资源浪费。当然,我们可以及时调整生成数据时的取模值,新生成的数据还是会分散到不同的机器上。

3、业务层面,选取状态(state)、类型(accountType)等字段作为分区维度

通过进行分片的方式达到多线程处理数据,从而加快批处理的速度,满足业务系统的需要。

分片技术使得任务可以在分布式的环境下运行,每台任务服务器只运行分配给该服务器的分片。 随着服务器的增加或宕机,分片技术会近乎实时的感知服务器数量的变更,从而重新为分布式的任务服务器分配更加合理的任务分片项,使得任务可以随着资源的增加而提升效率。

步进式算法的应用

根据业务场景,使用算法,减少查询次数,从而降低系统负载。在被补偿状态的初始化时,同时给定该订单一个下次补偿查询时间和查询次数(0)定时跑批,仅处理较小一段范围,

约束公式:订单.下次补偿时间 >= 定时任务心跳系统时间 - N次心跳间隔。

如满足以上条件即为本次处理范围,进行业务处理。假设业务补偿成功,此订单无需继续补偿,则进行订单处理(如修改状态)后,不更新下次补偿时间,不累计补偿次数。假设业务补偿失败,此订单仍需继续补偿,则修改下次补偿时间,补偿次数加1。通过该算法的应用使得补偿次数越多,补偿间隔越长,跳过的批次越多,这样就完成了减少查询次数,从而降低系统负载。

分页处理的应用

在算法领域有一很经典的思想,分治法也称为分解法、分治策略等。将一个复杂的问题进行分隔处理。从而起到“大事化小,小事化了”的作用。在支付场景中都以oracle数据库作持久化的中间件。

第一种逻辑分页,将数据全部查询取,然后返回需要的部分:

select * from (select rownum a, ARTICLEW.XMLDOC from ARTICLEW ) t where t.a between 1 and 200 ;

第二种临时表分布

select * from (select rownum, t.* from (select xmldoc from articlew) t where t.rownum<=200) where rownum >=1

对于第一个分页查询的语句,Oracle内部,首先会做全表扫描,把所有符合条件的数据,全部返回,而真正的我们分页所需要的数据,仅仅是在Between 和and之后才进行过滤筛选。对于第二个查询语句,第二层的查询条件WHERE ROWNUM <= 200就可以被Oracle推入到内层查询中,这样Oracle查询的结果一旦超过了ROWNUM限制条件,就立即终止查询,仅仅把我们所需要的数据拿出来,是真正的按需所取。

总结

在不同的应用场景中可以有不同的实现方案,我们需要根据业务场景各种限制条件选择相对适合的批处理技术进行实现。分片技术、分页技术、步进式算法在当下微服务架构的系统中都有着举足轻重的作用。正所谓没有最好的批处理技术,只有最适合当前场景的技术。

相关推荐

MySQL数据库中,数据量越来越大,有什么具体的优化方案么?

个人的观点,这种大表的优化,不一定上来就要分库分表,因为表一旦被拆分,开发、运维的复杂度会直线上升,而大多数公司和开发人员是欠缺这种能力的。所以MySQL中几百万甚至小几千万的表,先考虑做单表的优化。...

Redis的Bitmap(位图):签到打卡、用户在线状态,用它一目了然

你是不是每天打开APP,第一时间就是去“签到打卡”?或者在社交软件里,看到你的朋友头像旁边亮着“在线”的绿灯?这些看似简单的功能背后,都隐藏着一个有趣而高效的数据结构。如果让你来设计一个签到系统:用户...

想知道有多少人看了你的文章?Redis HyperLogLog几KB就搞定!

作为一名内容创作者,你每天最期待的,除了文章阅读量蹭蹭上涨,是不是还特别想知道,到底有多少个“独立用户”阅读了你的文章?这个数字,我们通常称为“UV”(UniqueVisitors),它比总阅读量更...

Redis的“HyperLogLog”:统计网站日活用户,省内存又高效的神器

你可能从未听过这个拗口的名字——“HyperLogLog”,它听起来就像是某个高深莫测的数学公式。但请相信我,理解它的核心思想并不难,而且一旦你掌握了它,你会发现它在处理大数据统计问题时,简直就是“救...

阿里云国际站:为什么我的云服务器运行缓慢?

本文由【云老大】TG@yunlaoda360撰写一、网络性能瓶颈带宽不足现象:上传/下载速度慢,远程连接卡顿。排查:通过阿里云控制台查看网络流量峰值是否接近带宽上限34。解决:升级带宽(如从1M提...

Java 近期新闻:Jakarta EE 11和Spring AI更新、WildFly 36.0 Beta、Infinispan

作者|MichaelRedlich译者|明知山策划|丁晓昀OpenJDKJEP503(移除32位x86移植版本)已从“ProposedtoTarget”状态进入到“T...

腾讯云国际站:怎样设置自动伸缩应对流量高峰?

云计算平台服务以阿里云为例:开通服务与创建伸缩组:登录阿里云控制台,找到弹性伸缩服务并开通。创建伸缩组时,选择地域与可用区,定义伸缩组内最小/最大实例数,绑定已有VPC虚拟交换机。实例模板需...

【案例分享】如何利用京东云建设高可用业务架构

本文以2022年一个实际项目为基础,来演示在京东云上构建高可用业务的整个过程。公有云及私有云客户可通过使用京东云的弹性IAAS、PAAS服务,创建高可用、高弹性、高可扩展、高安全的云上业务环境,提升业...

Spring Security在前后端分离项目中的使用

1文章导读SpringSecurity是Spring家族中的一个安全管理框架,可以和SpringBoot项目很方便的集成。SpringSecurity框架的两大核心功能:认证和授权认证:...

Redis与Java集成的最佳实践

Redis与Java集成的最佳实践在当今互联网飞速发展的时代,缓存技术的重要性毋庸置疑。Redis作为一款高性能的分布式缓存数据库,与Java语言的结合更是如虎添翼。今天,我们就来聊聊Redis与Ja...

Redis在Java项目中的应用与数据持久化

Redis在Java项目中的应用与数据持久化Redis简介:为什么我们需要它?在Java项目中,Redis就像一位不知疲倦的快跑选手,总能在关键时刻挺身而出。作为一个内存数据库,它在处理高并发请求时表...

Redis 集群最大节点个数是多少?

Redis集群最大节点个数取决于Redis的哈希槽数量,因为每个节点可以负责多个哈希槽。在Redis3.0之前,Redis集群最多支持16384个哈希槽,因此最大节点数为16384个。但是在Redi...

Java开发岗面试宝典:分布式相关问答详解

今天千锋广州Java小编就给大家分享一些就业面试宝典之分布式相关问题,一起来看看吧!1.Redis和Memcache的区别?1、存储方式Memecache把数据全部存在内存之中,断电后会挂掉,数据不...

当Redis内存不足时,除了加内存,还有哪些曲线救国的办法?

作为“速度之王”的Redis,其高性能的秘密武器之一就是将数据存储在内存中。然而,内存资源是有限且昂贵的。当你的Redis实例开始告警“内存不足”,或者写入请求被阻塞时,最直接的解决方案似乎就是“加内...

商品详情页那么多信息,Redis的“哈希”如何优雅存储?

你每天网购时,无论是打开淘宝、京东还是拼多多,看到的商品详情页都琳琅满目:商品名称、价格、库存、图片、描述、评价数量、销量。这些信息加起来,多的惊人。那么问题来了:这些海量的商品信息,程序是去哪里取出...

取消回复欢迎 发表评论: