百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术教程 > 正文

oracle嵌套循环和多结果集嵌套循环处理优化

mhr18 2024-10-03 22:25 18 浏览 0 评论

概述

嵌套循环连接处理的两个数据集被称为外部循环(outer loop,也就是驱动数据源,driving row soulce )和内部循环〔 inner loop )。外部循环为左子节点,内部循环为右子节点。当外部循环执行一次的时候,内部循环需要针对外部循环返回的每条记录执行一次。


处理过程

外部循环称为外表或者驱动表,而内部循环称为内表或者被驱动表。

嵌套循环连接有以下几点特征:

口左子节点(外部循环)只会执行一次,而右子节点(内部循环)一般会执行很多次。

口在所有数据处理完之前,就可以返回结果集的第一条记录。

口可以有效利用索引来处理限制条件与连接条件。

口支持所有类型的连接。


两表连接

下面是个简单的两表嵌套循环连接的执行计划。同时也描述了如何使用提示1eading 与use_nl来强制使用嵌套循环连接。Leading提示要求先访问表tl ,也就是,它指定了哪张表作为外部循环表使用。use_nl提示指定了具体使用哪种连接方法来将内部循环返回的数据(表t2 )与表t1 连接起来。有必要指出的是:usenl 提示并没有引用表t1 。

SELECT /* + leading (t1) use_nl(t2) full(t1) full(t2)*/ * FROM t1 ,t2 WHERE tl.id =t2.id AND tl.n=19

NESTED LOOPS操作是一种相关联合型操作。它意味着是第二个子节点(内部循环)的执行是由第一个子节点(外部循环)控制的。在这个例子中,执行计划的执行过程可以总结如下。

口 通过全表扫描访问表t1 的所有记录,访问中应用限制条件n = 19 过滤数据口

口 前面一个步骤返回多少条记录,就在表t2 上执行多少次全表扫描。

无疑,当操作2 返回的记录超过1 条时,这种执行计划就不是很有效了,因此,查询优化器几乎从来不会选择它。正是因为这个原因,才必须指定两个访问提示(full)来强制查询优化器使用这个执行计划。另一方面,如果外部循环只返回一条记录,并且内部循环的选择性也很高,对表t2 进行全表扫描可能也不错。为了展示这一点,下面我们在表t1 的n 字段卜创建一个唯一索引:

CREATE UNIQUE INDEX t1_n ON t1(n) 

有了这个索引以后,前面的语句就以下面的执行计一划执行了。由于操作3 (INDEX UNIQUE SCAN)的缘故,可以确保内部循环只会被执行一次。

SELECT /* + leading (t1) use_nl(t2) index(t1) full(t2)*/ * 
FROM t1 ,t2 WHERE tl.id =t2.id AND tl.n=19

如果内部循环的选择性很低,对内部循环适应索引扫描就是一个较好的选择。由于嵌套循环连接是相关联合型操作,对内部循环来讲,这个地方也可能利用到连接条件。例如,在下面的执行计划中,操作5就是利用操作3的返回值t1.id做了索引查找。

SELECT /* + leading (t1) use_nl(t2) index(t1) index(t2)*/ * FROM t1 ,t2 WHERE tl.id =t2.id AND tl.n=19

通过建立2个索引,使得性能得到最好的优化。嵌套循环适合2个选择性低的效率数据量的选择,到数据量大的时候优化器会默认选择hash join 连接,除非我们手动选择提示,并且通过索引来达到很好的效率。

总的来讲,如果内部循环会执行多次,只有具有好的选择性的访问路径以及导致比较少的逻辑读的路径才有意义


四表连接

下面的执行计划是个典型的用嵌套循环连接实现的左深树。请注意各个表是如何通过索引进行访问的ordered 提示要求这些表按它们在FROM 子句中的顺序进行访问。use_nl提示要求后面的表与第一张表(或者前面一个操作的结果集)进行连接的时候使用嵌套循环连接。

SELECT /* + ordered use_nl(t2 t3 t4)*/ t1.*,t2.*,t3.*,t4.* 
FROM t1,t2,t3,t4 
WHERE t1.id = t2.t1_id 
AND t2.id =t3.t2_id
AND t3.id =t4.t3_id 
AND t1.n = 19

这种执行计划的执行流程可以总结如下(不考虑使用行预取的情况):

( 1)当读取第一条记录的时候(也就是说,不是当这条语句解析或者执行的时候),在应用了表t1 上的限制条件tl.n = 19 并取得第一条记录的时候,处理过程就开始了。
( 2)表t2 基于表t1 找到的结果进行查找。数据库引擎会利用连接条件tl.id = t2.t1_id 来访问表t2。事实上.表t2 上没有任何限制条件。只有第一条满足连接条件的记录才会返回给上级操作。
( 3)表t3 基于表t2 找到的结果进行查找数据库引擎也是利用连接条件t2.id =t3.t2_id 来访问表t3 。只有第一条满足连接条件的记录才会返回给上一级操作。
( 4)表t4 基于表t3 找到的结果进行查找。这儿也一样,数据库引擎也是利用连接条件t3.id =t4.t3_id 来访问表t4 。满足条件的第一条记录会立即返回给客户端。
( 5)后续的操作也是按照第一条记录样的行为来进行的。很明显,执行过程是在下一次匹配(也可能是表t4 里面匹配的第二条记录,如果有的话)的位置开始的。需要特别强调的是,满足条件的记录会在第一时间被返回给客户端。换句话讲,就是完全没有必要在返回第条记录之前完成整个执行过程。

块预取

在一般情况下,当缓存没有命中的时候,基于单块处理(例如,rowid 访问、索引范围扫描)的访问路径会导致一个单块的物理读。对于嵌套循环连接来讲,特别是当有很多行数据需要处理的时候,效率会比较差。实际上很多时候,嵌套循环连接也会使用多个单块物理读来访问多个相邻的块。数据库引擎可以利用块预取功能来提高嵌套循环连接的效率。这种优化技巧的目的是,对与多个相邻的块使用一次多块物理读取,来代替多次单块物理读取。块预取对于表和索引都是适用的。无法通过查看执行计划来看出数据库引擎是否使用了块预取功能。唯一能够看到的方式是,查看服务器进程执行的物理读,特别是与物理读相关的等待事件。

口db file sequential read 是个与单块物理读取相关的事件。因此,如果这个事件出现,就意味着块预取要么没有被使用,要么是无法被使用(例如,由于请求的块己经在高速缓存中)。

口db file scattered read 是一个与多块物理读取相关的事件。因此.如果在~id 访问或者索引范围扫描中看到这个等待事件,就表明在使用块预取功能。

需要特别提示的是,我们无法控制块预取功能的使用。如何以及是否使用块预取功能是由数据库引擎决定的。

其他可选的执行计划可以用下面的执行计划来执行嵌套循环连接。

实际上,在Oracle 的最近几个版本中,只有当内部循环或者外部循环是基于唯一索引扫描(index unique scan )的时候才会使用这种类型的执行计划。下面我们来看看,如果在列n 上的索引t1_n 如下面这样定义(为非唯一)时会如何:

CREATE INDEX t1_n ON t1(n) 

当换成这个索引时,下面的执行计划将被采用。请注意,表t2 上的rowid 访问是处在不同的位置的.在前一个执行计划,它是在操作4 ,然而在后一个执行计划中,它是在操作1 。比较特别的是,row 记访问(操作1)的子操作是一个嵌套循环连接(操作2 )。从我们的角度看,这两个执行计划做了同一件事。下面的这个执行计划可能是为了利用一些内部优化(比如块预取)。

在oracle 11g 中,可能会使用下面的执行计划,而不是之前的那个。注意,虽然查询始终是一个两表连接,执行计划却含有两个嵌套循环连接!


oracle多结果集嵌套循环处理优化

--性能差
begin
 for a in (select id,name,sex,idcard from people) loop
 for b in (select id,name,sex,idcard from english) loop
 if a.idcard = b.idcard then
 --do something
 end if;
 end loop;
 end loop;
end;

优化后如下:

--性能优:将多表合并成一个结果集,避免嵌套循环
begin
 for a in (select p.id,p.name,p.sex,p.idcard from people p,english e where p.idcard = e.idcard) loop
 --do something
 end loop;
end;

关于嵌套循环方面的内容就介绍到这了,后面会分享更多DBA方面内容,感兴趣的朋友可以关注下 !

相关推荐

【推荐】一个开源免费、AI 驱动的智能数据管理系统,支持多数据库

如果您对源码&技术感兴趣,请点赞+收藏+转发+关注,大家的支持是我分享最大的动力!!!.前言在当今数据驱动的时代,高效、智能地管理数据已成为企业和个人不可或缺的能力。为了满足这一需求,我们推出了这款开...

Pure Storage推出统一数据管理云平台及新闪存阵列

PureStorage公司今日推出企业数据云(EnterpriseDataCloud),称其为组织在混合环境中存储、管理和使用数据方式的全面架构升级。该公司表示,EDC使组织能够在本地、云端和混...

对Java学习的10条建议(对java课程的建议)

不少Java的初学者一开始都是信心满满准备迎接挑战,但是经过一段时间的学习之后,多少都会碰到各种挫败,以下北风网就总结一些对于初学者非常有用的建议,希望能够给他们解决现实中的问题。Java编程的准备:...

SQLShift 重大更新:Oracle→PostgreSQL 存储过程转换功能上线!

官网:https://sqlshift.cn/6月,SQLShift迎来重大版本更新!作为国内首个支持Oracle->OceanBase存储过程智能转换的工具,SQLShift在过去一...

JDK21有没有什么稳定、简单又强势的特性?

佳未阿里云开发者2025年03月05日08:30浙江阿里妹导读这篇文章主要介绍了Java虚拟线程的发展及其在AJDK中的实现和优化。阅前声明:本文介绍的内容基于AJDK21.0.5[1]以及以上...

「松勤软件测试」网站总出现404 bug?总结8个原因,不信解决不了

在进行网站测试的时候,有没有碰到过网站崩溃,打不开,出现404错误等各种现象,如果你碰到了,那么恭喜你,你的网站出问题了,是什么原因导致网站出问题呢,根据松勤软件测试的总结如下:01数据库中的表空间不...

Java面试题及答案最全总结(2025版)

大家好,我是Java面试陪考员最近很多小伙伴在忙着找工作,给大家整理了一份非常全面的Java面试题及答案。涉及的内容非常全面,包含:Spring、MySQL、JVM、Redis、Linux、Sprin...

数据库日常运维工作内容(数据库日常运维 工作内容)

#数据库日常运维工作包括哪些内容?#数据库日常运维工作是一个涵盖多个层面的综合性任务,以下是详细的分类和内容说明:一、数据库运维核心工作监控与告警性能监控:实时监控CPU、内存、I/O、连接数、锁等待...

分布式之系统底层原理(上)(底层分布式技术)

作者:allanpan,腾讯IEG高级后台工程师导言分布式事务是分布式系统必不可少的组成部分,基本上只要实现一个分布式系统就逃不开对分布式事务的支持。本文从分布式事务这个概念切入,尝试对分布式事务...

oracle 死锁了怎么办?kill 进程 直接上干货

1、查看死锁是否存在selectusername,lockwait,status,machine,programfromv$sessionwheresidin(selectsession...

SpringBoot 各种分页查询方式详解(全网最全)

一、分页查询基础概念与原理1.1什么是分页查询分页查询是指将大量数据分割成多个小块(页)进行展示的技术,它是现代Web应用中必不可少的功能。想象一下你去图书馆找书,如果所有书都堆在一张桌子上,你很难...

《战场兄弟》全事件攻略 一般事件合同事件红装及隐藏职业攻略

《战场兄弟》全事件攻略,一般事件合同事件红装及隐藏职业攻略。《战场兄弟》事件奖励,事件条件。《战场兄弟》是OverhypeStudios制作发行的一款由xcom和桌游为灵感来源,以中世纪、低魔奇幻为...

LoadRunner(loadrunner录制不到脚本)

一、核心组件与工作流程LoadRunner性能测试工具-并发测试-正版软件下载-使用教程-价格-官方代理商的架构围绕三大核心组件构建,形成完整测试闭环:VirtualUserGenerator(...

Redis数据类型介绍(redis 数据类型)

介绍Redis支持五种数据类型:String(字符串),Hash(哈希),List(列表),Set(集合)及Zset(sortedset:有序集合)。1、字符串类型概述1.1、数据类型Redis支持...

RMAN备份监控及优化总结(rman备份原理)

今天主要介绍一下如何对RMAN备份监控及优化,这里就不讲rman备份的一些原理了,仅供参考。一、监控RMAN备份1、确定备份源与备份设备的最大速度从磁盘读的速度和磁带写的带度、备份的速度不可能超出这两...

取消回复欢迎 发表评论: