百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术教程 > 正文

优化 Oracle 数据库分页查询:让查询更高效

mhr18 2025-01-03 17:34 18 浏览 0 评论

一、Oracle数据库的分页操作

对于Oracle数据库的分页查询语句一般采用如下的方式。

二、Oracle数据库的分页操作的性能分析和调优

按照分页操作的SQL语句的复杂度,可以将分页操作的种类分为只包含排序操作的分页、包含过滤操作和排序操作的单表查询分页、包含过滤操作和排序操作的单分区表查询分页、包含过滤操作和排序操作的表关联查询分页等几种类型。

1.只包含排序操作的分页

一般地,分页操作的SQL语句带有排序操作,即:order by。例如:在客户访问记录表中查询最新访问的30个客户,这就需要按照客户的访问时间进行降序排序。

对于这类分页操作的调优,需要利用索引是有序的特性,为order by中的排序列设置索引。

如果是对多个列进行排序,需要为所有的排序列创建一个复合索引,创建时需要注意复合索引中的各列的顺序需要与order by中指定的各排序列的顺序一致,且还需注意索引是升序还是降序,以下示例1展示了该类SQL语句的调优。

【示例1】

对名为user的用户信息表执行分页查询,查询最近访问但积分最低的前10位用户,分页语句如下所示。

user表中的记录数为300万左右。

为排序列创建一个复合索引,usercore列在前,lasttime列在后,且将lasttime列的索引设置为降序,即:

创建索引后,该语句的真实执行计划中的核心内容如下图所示。

通过以上的执行计划可以知:

(1)该SQL语句执行时访问User表时采用了INDEX FULL SCAN(索引快速全扫)的访问方式(因为未指定过滤条件,所以只能采用INDEX FULL SCAN的访问方式);

(2)执行INDEX FULL SCAN时访问10条记录后,已经满足分页要求,扫描终止,该SQL语句执行完毕。即上图执行计划中的COUNT STOPKEY(COUNT STOPKEY一旦获取到满足分页条件所需的记录后即停止SQL语句的执行)操作;

(3)执行计划中没有诸如SORT ORDER BY、SORT ORDER BY ROWNUM之类的排序操作,说明以上SQL语句执行时利用了索引消除了排序操作。

综上所述可知,该SQL的执行计划是正确的,高效的。

此外,对于只有1个列的降序排序操作,也可以不将该列的索引设置为降序索引,而是创建一般的升序索引,在查询执行时使用index_desc提示器,使得执行对该索引的扫描时采用降序扫描的方式。

如果创建符合索引时,排序列的顺序与order by中的排序列顺序不一致,在查询执行时,排序列的索引将仅用于通过索引访问记录,之后对获取的结果集再执行一次额外的排序操作,执行计划中将出现SORT ORDER BY或SORT ORDER BY ROWNUM之类的排序操作提示,说明并未利用索引消除排序操作。

如果创建的索引的顺序与实际排序的顺序不一致,例如:降序排序,升序索引,执行时也未使用index_desc提示器,则在查询执行时,排序列的索引也将仅用于通过索引访问记录,之后也要对获取的结果集再执行一次额外的排序操作。

2. 包含过滤条件和排序操作的分页

对于包含过滤条件和排序的分页,除了为排序列创建索引外,还需要为过滤条件创建索引。根据过滤条件的不同,又分为等值过滤和非等值过滤。

Ⅰ.等值过滤

如果分页语句中包含等值过滤和排序,此时需要为等值过滤列和排序列创建复合索引,该复合索引的顺序为等值过滤列在前,排序列在后,即:

(等值过滤列1,等值过滤列2,...,排序列1,排序列2,...)

以下示例2展示了该类SQL语句的调优。

【示例2】

对名为user的用户信息表执行分页查询,查询最近访问但积分最低的前10位类别为C类用户,分页语句如下所示。

为等值过滤列,排序列创建一个复合索引,按userclass,userscore,lasttime的顺序创建,即:

创建索引后,该语句的真实执行计划中的核心内容如下图所示。

通过以上的执行计划可以知:

(1)该SQL语句执行时访问User表时采用了INDEX RANGE SCAN(索引范围扫描)的访问方式,因为已经指定了过滤条件,且为过滤条件列设置了索引。

(2)执行INDEX RANGE SCAN时访问10条记录后,已经满足分页要求,扫描终止,该SQL语句执行完毕。即上图执行计划中的COUNT STOPKEY操作;

(3)执行计划中没有诸如SORT ORDER BY、SORT ORDER BY ROWNUM之类的排序操作,说明以上SQL语句执行时利用了索引消除了排序操作。

综上所述可知,该SQL的执行计划是正确的,高效的。

需要注意的是,创建复合索引时等值过滤条件列要放在排序列之前,如果将其放在排序列之后,即:按userscore,lasttime,userclass,的顺序创建上述分页语句的真实执行计划将变为如下图所示的。

通过以上的执行计划可以发现,对user表的访问方式由INDEX RANGE SCAN变为INDEX FULL SCAN方式。

过滤执行时为执行计划中id为7中对应的access和filter两种方式的结合,该方式说明在使用userclass列上索引访问user表时在执行索引扫描的同时又执行了对记录的过滤操作。具体操作为:扫描索引时,同时对每条索引按照过滤条件,如果符合过滤条件的记录达到分页操作指定的10条后,扫描停止。

这种边扫描边过滤的访问方式的执行效率较直接执行INDEX RANGE SCAN的访问方式稍低,因为这种方式的逻辑读多于INDEX RANGE SCAN方式。

Ⅱ.等值过滤和非等值过滤

如果分页语句中包含等值过滤非等值过滤和排序,创建复合索引时,需要将等值过滤列放在前部,排序列放在中部,非等值过滤列放在后部,即:

(等值过滤列1,等值过滤列2,...,排序列1,排序列2,...,非等值过滤列1,非等值过滤列2...)

同样地,如果分页语句中只有非等值过滤和排序,则需要将非等值过滤列放到复合索引的后部,以下示例2展示了该类SQL语句的调优。

【示例3】

对名为user的用户信息表执行分页查询,查询最近访问但积分最低的且注册时间大于18个月的前10位类别为C类用户,分页语句如下所示。

为等值过滤列,非等值过滤列,排序列创建一个复合索引,按userclass,userscore,lasttime,regtime的顺序创建,即:

创建索引后,该语句的真实执行计划中的核心内容如下图所示。

通过以上的执行计划可以知,该分页SQL查询执行时已经消除了排序操作,且对user的访问方式为INDEX RANGE SCAN(索引范围扫描),因为创建复合索引时将非等值过滤列regtime放到了排序列之后,所以执行INDEX RANGE SCAN时又进行了过滤操作,虽然这种方式的执行性能稍低于直接执行INDEX RANGE SCAN,但如果创建复合索引时将非等值过滤列regtime放到了排序列之后,该分页SQL查询的真实执行计划将变为如下图所示的形式。

该执行计划中出现了 SORT ORDER BY排序操作,且执行INDEX RANGE SCAN时扫描了6389条记录,说明查询执行时未利用索引是有序的特性,对查询结果结果集又执行了排序操作并只获取了前10条记录,显然,这种方式的执行效率和性能相比INDEX RANGE SCAN和过滤方式是较差的。

2. 包含过滤操作和排序操作的单分区表查询分页

上述介绍的通过创建适当的索引调优分页操作的方法同样适用于分区表的分页查询。

Oracle数据库的分区表的索引分为本地索引(Local Index)和全局(Global Index)索引两种类型。

本地索引(Local Index)的分区与表的分区完全相同,每个分区都有自己的本地索引分区。本地索引的维护由Oracle自动进行,通常本地索引的维护代价较低。

全局索引(Global Index)与表的分区无关,因此它只有一个分区。全局索引的维护和更新对于表的分区变化的响应速度可能较慢,但是在全局索引分区上可以执行跨分区的查询操作。

通过以上对两种索引的介绍可知,为分区表创建索引时需要在本地索引与全局索引中做出选择,选则原则如下。

(1)如果分页查询操作只访问一个分区,则可以为相应的列创建本地索引;

(2)如果分页查询操作需要访问多个分区(跨分区访问),则需要为相应的列创建全局索引,否则无法确保分页操作中排序操作的顺序也索引的顺序一致,从而无法利用索引的有序性消除分页中的排序操作;

(3)在分页查询操作中没有过滤条件的情景下,查询执行时将扫描分区表中的所有分区,如果该分页查询中的排序列就是创建分区表时的范围分区列,且范围分区中每个分区中的数据是递增的,此时可以为排序列创建本地索引。如果创建的分区是HASH分区或LIST分区,因为这两类分区是无序的,所以需要为排序列创建全局索引。

2. 表关联查询分页

对于多表关联排序的调优,需要遵循以下的原则。

(1)将表关联方式调整为嵌套循环关联,需要对哪个表排序,则应该该表作为驱动表,注意驱动表返回的数据顺序应与排序的顺序一致。如果采用外连接,则采用嵌套循环关联时,驱动表只能为主表;

(2)根据(1)可知,排序列只来自于嵌套循环关联的驱动表,即:只能对一个表排序,如果排序列即来自驱动表也来自被驱动表,则需要等表关联全部执行完成后,对结果集执行一次排序,导致排序操作无法消除;

(3)关联分页查询语句中不能出现max、min、avg之类的聚合函数,也不能出现去重(distinct)、分组(group by)、并(union/union all)等操作,这些操作会使得全部关联操作完成之后再进行分页,执行性能较低。

【示例4】

对 CD_U_MC_MODEL_REMINDER_ORGCUST(A)和CD_U_ MC MODEI_REMINDER(B)表执行关联,并进行分页操作,排序后获取前50条记录,SQL语句如下。

其中CD_U_MC_MODEL_REMINDER_ORGCUST表记录较多,达到3千万左右,该SQL语句执行较慢,平均执行用时16秒左右。

经对执行计划进行分析,语句中存在SORT ORDER BY ROWNUM排序操作,该SQL执行表表关联后,返回的结果集较大,达到300万条记录,对300万条进行排序,造成了较大的开销,且因为PGA空间有限,排序占用了临时表空间,同时造成了一定的I/O开销(出现direct path readtemp 和direct path write temp事件)。

对该SQL查询调优的首要就是消除排序,因排序列为CD_U_MC_MODEL_REMINDER_ORGCUST表,所以,为该表创建一个联合索引,按“(等值过滤列,关联列,排序列)”的顺序依次创建,需要注意的是,该SQL查询按CD_U_MC_MODEL_REMINDER_ORGCUST表的reach_date列降序排序,reach_date列需要创建降序索引,创建索引的语句如下。

创建索引后,该SQL语句的执行计划如下所示。

通过执行计划可以发现,排序操作已被消除,优化器选择了嵌套循环关联,并以排序列所属的CD_U_MC_MODEL_REMINDER_ORGCUST表作为嵌套循环关联的驱动表。

实际执行该SQL语句,查询用时降至0.6秒左右。

继续对该查询进行优化,通过进一步分析CD_U_MC_MODEL_REMINDER_ORGCUST表的数据分布,发现该表的记录按procod列的数据分布,整个表中procod列的值约有30个,每个值对应的记录数在100万-300万条左右,查询执行时对CD_U_MC_MODEL_REMINDER_ORGCUST表按procod的值进行了过滤。因此,我们可以将CD_U_MC_MODEL_REMINDER_ORGCUST表按procod的值进行分区,创建非HASH/LIST分区。此外,每次查询时procod只指定一个值,不存在跨分区查询,所以,为procod列创建本地索引即可。

经过以上第二次调优后,该SQL语句的执行计划如下所示。

通过以上的执行计划可以发现,对CD_U_MC_MODEL_REMINDER_ORGCUST表的访问只扫描了一个分区,该SQL语句的执行时间进一步降低至10毫秒左右。

相关推荐

Redis合集-使用benchmark性能测试

采用开源Redis的redis-benchmark工具进行压测,它是Redis官方的性能测试工具,可以有效地测试Redis服务的性能。本次测试使用Redis官方最新的代码进行编译,详情请参见Redis...

Java简历总被已读不回?面试挂到怀疑人生?这几点你可能真没做好

最近看了几十份简历,发现大部分人不是技术差,而是不会“卖自己”——一、简历死穴:你写的不是经验,是岗位说明书!反面教材:ד使用SpringBoot开发项目”ד负责用户模块功能实现”救命写法:...

redission YYDS(redission官网)

每天分享一个架构知识Redission是一个基于Redis的分布式Java锁框架,它提供了各种锁实现,包括可重入锁、公平锁、读写锁等。使用Redission可以方便地实现分布式锁。red...

从数据库行锁到分布式事务:电商库存防超卖的九重劫难与破局之道

2023年6月18日我们维护的电商平台在零点刚过3秒就遭遇了严重事故。监控大屏显示某爆款手机SKU_IPHONE13_PRO_MAX在库存仅剩500台时,订单系统却产生了1200笔有效订单。事故复盘发...

SpringBoot系列——实战11:接口幂等性的形而上思...

欢迎关注、点赞、收藏。幂等性不仅是一种技术需求,更是数字文明对确定性追求的体现。在充满不确定性的网络世界中,它为我们建立起可依赖的存在秩序,这或许正是技术哲学最深刻的价值所在。幂等性的本质困境在支付系...

如何优化系统架构设计缓解流量压力提升并发性能?Java实战分享

如何优化系统架构设计缓解流量压力提升并发性能?Java实战分享在高流量场景下。首先,我需要回忆一下常见的优化策略,比如负载均衡、缓存、数据库优化、微服务拆分这些。不过,可能还需要考虑用户的具体情况,比...

Java面试题: 项目开发中的有哪些成长?该如何回答

在Java面试中,当被问到“项目中的成长点”时,面试官不仅想了解你的技术能力,更希望看到你的问题解决能力、学习迭代意识以及对项目的深度思考。以下是回答的策略和示例,帮助你清晰、有说服力地展示成长点:一...

互联网大厂后端必看!Spring Boot 如何实现高并发抢券逻辑?

你有没有遇到过这样的情况?在电商大促时,系统上线了抢券活动,结果活动刚一开始,服务器就不堪重负,出现超卖、系统崩溃等问题。又或者用户疯狂点击抢券按钮,最后却被告知无券可抢,体验极差。作为互联网大厂的后...

每日一题 |10W QPS高并发限流方案设计(含真实代码)

面试场景还原面试官:“如果系统要承载10WQPS的高并发流量,你会如何设计限流方案?”你:“(稳住,我要从限流算法到分布式架构全盘分析)…”一、为什么需要限流?核心矛盾:系统资源(CPU/内存/数据...

Java面试题:服务雪崩如何解决?90%人栽了

服务雪崩是指微服务架构中,由于某个服务出现故障,导致故障在服务之间不断传递和扩散,最终造成整个系统崩溃的现象。以下是一些解决服务雪崩问题的常见方法:限流限制请求速率:通过限流算法(如令牌桶算法、漏桶算...

面试题官:高并发经验有吗,并发量多少,如何回复?

一、有实际高并发经验(建议结构)直接量化"在XX项目中,系统日活用户约XX万,核心接口峰值QPS达到XX,TPS处理能力为XX/秒。通过压力测试验证过XX并发线程下的稳定性。"技术方案...

瞬时流量高并发“保命指南”:这样做系统稳如泰山,老板跪求加薪

“系统崩了,用户骂了,年终奖飞了!”——这是多少程序员在瞬时大流量下的真实噩梦?双11秒杀、春运抢票、直播带货……每秒百万请求的冲击,你的代码扛得住吗?2025年了,为什么你的系统一遇高并发就“躺平”...

其实很多Java工程师不是能力不够,是没找到展示自己的正确姿势。

其实很多Java工程师不是能力不够,是没找到展示自己的正确姿势。比如上周有个小伙伴找我,五年经验但简历全是'参与系统设计''优化接口性能'这种空话。我就问他:你做的秒杀...

PHP技能评测(php等级考试)

公司出了一些自我评测的PHP题目,现将题目和答案记录于此,以方便记忆。1.魔术函数有哪些,分别在什么时候调用?__construct(),类的构造函数__destruct(),类的析构函数__cal...

你的简历在HR眼里是青铜还是王者?

你的简历在HR眼里是青铜还是王者?兄弟,简历投了100份没反应?面试总在第三轮被刷?别急着怀疑人生,你可能只是踩了这些"隐形求职雷"。帮3630+程序员改简历+面试指导和处理空窗期时间...

取消回复欢迎 发表评论: