百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术教程 > 正文

【Oracle】多表联合查询超时问题排查

mhr18 2024-09-23 09:38 22 浏览 0 评论

文中使用的Oracle版本为10g。
本文内容将涉及大规模SQL联合查询优化内容,本人尽可能讲得容易理解一些,若有看不懂的地方是本人表述不清楚,望各位海涵。此外文章是2016年写的,那时候本人能力有限所以文章中的排查方式或者解决方法都有一定的局限性(现在会更优的做法),因此各位将就着看,仅代表个人看法,谢谢。

排查

本次性能排查的SQL是典型的“业务优先”**(根据业务逻辑直接转换为代码,不存在设计模式或者性能优化的思考)**脚本,相信大家在开发的过程中多多少少都会遇到过。其实就是每个业务来自一个表,表是同构的,但是查询的时候需要将所有的表都UNION ALL进行数据集整合输出,类似于这种情况吧。
为此,每一种分类统计SQL 基本格式都是:

SELECT SUM(TOTAL) TOTAL, 'YX' TYPE
FROM (SELECT *
              FROM GATHER_STATISTIC_UNIT_YX
              WHERE WRITEDATE >= TO_DATE('1992-11-11 00:00:00', 'yyyy-mm-dd hh24:mi:ss')
              	AND WRITEDATE <= TO_DATE('2016-11-11 23:59:59', 'yyyy-mm-dd hh24:mi:ss'))
 INNER JOIN (SELECT ID
               		FROM UMS_ORG
              		START WITH ID = '123400000000'
             		CONNECT BY PRIOR ID = PID) U ON UNIT = U.ID

之后通过UNION ALL 将所有类型合并起来,这种组合方式是比较清晰和直观的。并且在使用聚合函数SUM、INNER JOIN之前都先通过条件语句缩小扫描范围,在得到数据集后再进行UNION ALL。基本上是合符性能优化的基本要求(尽管还可以将*替换成具体的字段,从而不需要全字段扫描)。但据了解INNER JOIN内集合查询的条件是会变化的,也就是说INNER JOIN中的语句每个分类都需要根据实际业务写一遍。这时我就会想,如果变化的内容是一样的话就使用WITH … AS的写法也不是不可以的。

但我还是太过天真了。在通读了设计文档后发现,需要UNION ALL的表有39个。这一听联合了39个表来查询肯定是这里出了问题啦。但是经过执行计划执行后发现真正的性能瓶颈应该是在每个分类的查询统计而不是UNION ALL上。下面先看看测试机的执行计划分析如下图:

执行计划内容太多了就不在这里贴出来了,但是可以看到虽然使用的资源有点多,但每个子SQL就性能来说不算太过离谱。执行到输出为25秒左右。这种执行效率不至于生产服务出现查询超时的情况。想到这同样的SQL在生产上执行“路线”(之前我们说过的执行选择器)会不太一样,于是让实施人员在现场连一下生产机,执行一下执行计划来看看。结果如下:

虽然执行计划有点多但还是可以看到一些问题的端倪。

为了方面理解,一段SORT AGGREGATE可以认为是一个分类段落。接着可以看到在测试机上都是用NESTED LOOPS的INNER JOIN操作,在生产机上大部分都使用了 HASH JOIN作为操作依据。这个先按下不表再往下看,看到View里面的执行ID使用的是DICT_DICT_KEY的索引,走的是INDE X RANGE SCAN。通过SQL可以知道,在INNER JOIN 之前UMS_ORG是做一个递归操作,找出了所有组织节点编码,如下:

SELECT ID
FROM UMS_ORG
START WITH ID = '123400000000'
CONNECT BY PRIOR ID = PID

ID字段是表中的唯一字段,而这里面居然做了RANGE SCAN,那么只能说这个View里面的ID字段被设置成了普通的B-TREE索引而已。测试机上设置的是主键,所以测试机上走的是INDEX UNIQUE SCAN。

除此之外,在递归之后还是需要用ID字段作为条件跟业务表中的UNIT字段进行INNER JOIN操作的,由于COST过大,所以在生产上选择使用了STATISTIC_YX_WRITEDATE索引做范围扫描。INNER JOIN 操作数据量大,系统选择了使用HASH JOIN来做连接操作了。
但是问题又来了,即使走了HASH JOIN,在若满足条件的情况下UNIT字段还是应该走STATISTIC_YX_UNIT索引的。

究竟是什么原因会导致不走索引?(开始头脑回溯那些不走索引的原因)其中最有可能的就是字段为空的情况了。于是使用了

SELECT COUNT(1) FROM GATHER_STATISTIC_UNIT_YX WHERE UNIT IS NULL;

得到了不为零的结果,这样就直接说明了不走索引的原因。
既然知道问题所在了,要修复就非常简单了这里就不再详细叙述。

结论

  1. 多表合并查询性能瓶颈不在于UNION ALL多少个表,而是串行子查询的效率问题;
  2. 部分走索引的情况应该首先检查表的异同,想到那些不走索引的情况,结合当前的情况进行验证;
  3. 做连接的字段无论是外连接还是内连接都必须建立索引,并且索引能够做成唯一的就必须做成唯一索引,查询效率不是一个等级;
  4. MERGE JOIN、NESTED LOOPS都会比HASH JOIN效率来得高,所以一般情况下尽量保证使用前者;
  5. 多次出现的SQL脚本可以做成WITH XXX AS (SELECT … FROM ...)这种方式。这次在排查的过程中看到每一个类型都需要INNER JOIN一个查询组织编码数据集在得到ID后来限制业务表中的数据输出,INNER JOIN里面的脚本可以做成:
WITH UORG AS (
	SELECT ID 
    	FROM UMS_ORG 
    	START WITH ID = '123400000000' 
	CONNECT BY PRIOR ID = PID 
)

放在整个查询语句的开头部分,INNER JOIN 时可以直接使用 INNER JOIN UORG U ON UNIT=U.ID 进行连接。WITH XXX AS 这种做法是将表放到内存里面从而减少磁盘IO的频繁读取或扫描,比较适合枚举表、字典表、组织架构表等数据量比较少而且比较固定的表来使用。

相关推荐

【推荐】一个开源免费、AI 驱动的智能数据管理系统,支持多数据库

如果您对源码&技术感兴趣,请点赞+收藏+转发+关注,大家的支持是我分享最大的动力!!!.前言在当今数据驱动的时代,高效、智能地管理数据已成为企业和个人不可或缺的能力。为了满足这一需求,我们推出了这款开...

Pure Storage推出统一数据管理云平台及新闪存阵列

PureStorage公司今日推出企业数据云(EnterpriseDataCloud),称其为组织在混合环境中存储、管理和使用数据方式的全面架构升级。该公司表示,EDC使组织能够在本地、云端和混...

对Java学习的10条建议(对java课程的建议)

不少Java的初学者一开始都是信心满满准备迎接挑战,但是经过一段时间的学习之后,多少都会碰到各种挫败,以下北风网就总结一些对于初学者非常有用的建议,希望能够给他们解决现实中的问题。Java编程的准备:...

SQLShift 重大更新:Oracle→PostgreSQL 存储过程转换功能上线!

官网:https://sqlshift.cn/6月,SQLShift迎来重大版本更新!作为国内首个支持Oracle->OceanBase存储过程智能转换的工具,SQLShift在过去一...

JDK21有没有什么稳定、简单又强势的特性?

佳未阿里云开发者2025年03月05日08:30浙江阿里妹导读这篇文章主要介绍了Java虚拟线程的发展及其在AJDK中的实现和优化。阅前声明:本文介绍的内容基于AJDK21.0.5[1]以及以上...

「松勤软件测试」网站总出现404 bug?总结8个原因,不信解决不了

在进行网站测试的时候,有没有碰到过网站崩溃,打不开,出现404错误等各种现象,如果你碰到了,那么恭喜你,你的网站出问题了,是什么原因导致网站出问题呢,根据松勤软件测试的总结如下:01数据库中的表空间不...

Java面试题及答案最全总结(2025版)

大家好,我是Java面试陪考员最近很多小伙伴在忙着找工作,给大家整理了一份非常全面的Java面试题及答案。涉及的内容非常全面,包含:Spring、MySQL、JVM、Redis、Linux、Sprin...

数据库日常运维工作内容(数据库日常运维 工作内容)

#数据库日常运维工作包括哪些内容?#数据库日常运维工作是一个涵盖多个层面的综合性任务,以下是详细的分类和内容说明:一、数据库运维核心工作监控与告警性能监控:实时监控CPU、内存、I/O、连接数、锁等待...

分布式之系统底层原理(上)(底层分布式技术)

作者:allanpan,腾讯IEG高级后台工程师导言分布式事务是分布式系统必不可少的组成部分,基本上只要实现一个分布式系统就逃不开对分布式事务的支持。本文从分布式事务这个概念切入,尝试对分布式事务...

oracle 死锁了怎么办?kill 进程 直接上干货

1、查看死锁是否存在selectusername,lockwait,status,machine,programfromv$sessionwheresidin(selectsession...

SpringBoot 各种分页查询方式详解(全网最全)

一、分页查询基础概念与原理1.1什么是分页查询分页查询是指将大量数据分割成多个小块(页)进行展示的技术,它是现代Web应用中必不可少的功能。想象一下你去图书馆找书,如果所有书都堆在一张桌子上,你很难...

《战场兄弟》全事件攻略 一般事件合同事件红装及隐藏职业攻略

《战场兄弟》全事件攻略,一般事件合同事件红装及隐藏职业攻略。《战场兄弟》事件奖励,事件条件。《战场兄弟》是OverhypeStudios制作发行的一款由xcom和桌游为灵感来源,以中世纪、低魔奇幻为...

LoadRunner(loadrunner录制不到脚本)

一、核心组件与工作流程LoadRunner性能测试工具-并发测试-正版软件下载-使用教程-价格-官方代理商的架构围绕三大核心组件构建,形成完整测试闭环:VirtualUserGenerator(...

Redis数据类型介绍(redis 数据类型)

介绍Redis支持五种数据类型:String(字符串),Hash(哈希),List(列表),Set(集合)及Zset(sortedset:有序集合)。1、字符串类型概述1.1、数据类型Redis支持...

RMAN备份监控及优化总结(rman备份原理)

今天主要介绍一下如何对RMAN备份监控及优化,这里就不讲rman备份的一些原理了,仅供参考。一、监控RMAN备份1、确定备份源与备份设备的最大速度从磁盘读的速度和磁带写的带度、备份的速度不可能超出这两...

取消回复欢迎 发表评论: