百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术教程 > 正文

优化必备基础:Oracle中常见的三种表连接方式

mhr18 2024-09-20 20:59 22 浏览 0 评论

在Oracle SQL语句中,如果from后面有多个表时,表的连接方式是一个很重要的考量。

从Oracle 6开始,优化器就支持下面4种表连接方式:

— 嵌套循环连接(Nested Loop Join)

— 群集连接(Cluster Join)

— 排序合并连接(Sort-Merge Join)

— 笛卡尔连接(Cartesian Join)

在Oracle 7.3中,新增加了哈希连接(Hash Join)。

在Oracle 8中,新增加了索引连接(Index Join)。

在这些表连接的方法中,Nested Loop Join和Hash Join及Sort-Merge Join是比较常见的。

(1)Nested Loop Join

这种场景一般适用于大表和小表的关联,准确来说应该是大的行集与小的行集,一般小表适用为驱动表,对于小表中的匹配记录和大表做关联,此时小表是在外部循环,大表在内部循环,小表中的记录都和大表做一个关联。

SQL> create table t as select *from dba_objects where object_id is not null;

SQL> create table t1 as select *from user_objects where object_id is not null;

SQL> exec dbms_stats.gather_table_stats(user,'T',cascade=>TRUE);

SQL> exec dbms_stats.gather_table_stats(user,'T1',cascade=>TRUE);

SQL> create unique index ind_t on t(object_id);

SQL> create unique index int_t1 on t1(object_id) ;

SQL> select count(*)from t;

COUNT(*)

----------

74552

下面的例子,表t1中的数据较少,表t中的数据多,就以表t1为驱动表,走了全索引扫描查取到t1的数据,然后对于t1中的数据和t做匹配,匹配时走了唯一性扫描。

.select t.object_id,t.object_name,t.object_type,t.status from t,t1 where t.object_id=t1.object_id;

(2)Hash Join

这种场景适用于大表和大表之间的关联。通过Hash算法来做两个表之间的匹配映射。

SQL> create table t as select *from dba_objects where object_id is not null;

SQL> create table t1 as select *from dba_objects where object_id is not null;

SQL> exec dbms_stats.gather_table_stats(user,'T',cascade=>TRUE);

SQL> exec dbms_stats.gather_table_stats(user,'T1',cascade=>TRUE);

SQL> create unique index ind_t on t(object_id);

SQL> create unique index int_t1 on t1(object_id) ;

SQL> select count(*)from t;

COUNT(*)

----------

74552

对于表t1中的记录,都是通过Hash映射来匹配表t中的记录。对于CPU的资源消耗还是相对较多的,因为内部做了大量的计算。从生产环境中的实践来说,Hash Join还是不错的,特别是在和并行结合之后。

select t.object_id,t.object_name,t.object_type,t.status from t,t1 where t.object_id=t1.object_id;

(3)Sort-Merge Join

对于Sort-Merge Join来说,可能略微有些陌生。

在数据库中有一个隐含参数对应,默认是开启的,见下表。

Sort-Merge Join相关参数

因为这种连结方式使用不当会消耗大量的系统资源,在一些生产系统中都选择手动禁用这种连结。

这种连结的运行原理相比Nested Loop Join和Hash Join而言没有驱动表,所以Sort-Merge Join可能会产生大量的随机读。

比如我们有表emp、dept。

查询语句为:

select empno,ename,dname,loc from emp,dept where emp.deptno =dept.deptno

如果采用Sort-Merge Join,就会对emp、dept表进行order by 的操作。

类似下面两个操作:

select empno,ename ,deptno from emp order by deptno;

select deptno,dname,loc from dept order by deptno;

因为排序后的数据都是有序的,然后对两个子结果集根据deptno进行匹配。

选择两端的数据列,根据列的要求筛选数据。

我们先来看一个使用Sort-Merge Join的执行计划,实际中需要用到Sort-Merge Join的场景就是在类似下面形式的查询中

where tab1.column1 between tab2.column2 and tab2.column3

我们可以使用Hint ordered来指定连接方式驱动,或者使用hint use_merge来引导查询走Sort-Merge Join,下面简单模拟一下。

(1)使用Hint ordered,语句如下。

SQL> select /*+ordered*/ empno,ename,dname,loc from emp,dept where emp.deptno between dept.deptno-10 and dept.deptno+10;

语句的执行计划如下:

Predicate Information (identified by operation id):

---------------------------------------------------

4 - filter("EMP"."DEPTNO"<="DEPT"."DEPTNO"+10)

5 - access(INTERNAL_FUNCTION("EMP"."DEPTNO")>="DEPT"."DEPTNO"-10)

filter(INTERNAL_FUNCTION("EMP"."DEPTNO")>="DEPT"."DEPTNO"-10)

可以看到对emp和dept都做了全表扫描,对数据进行了排序,然后根据deptno对结果集进行了匹配和关联,最后把结果集输出。

(2)使用Hint use_merge来实现相同的效果。

SQL> select /*+use_merge(dept,emp)*/ empno,ename,dname,loc from emp,dept where emp.deptno between dept.deptno-10 and dept.deptno+10;

语句的执行计划如下:

Predicate Information (identified by operation id):

---------------------------------------------------

4 - filter("EMP"."DEPTNO"<="DEPT"."DEPTNO"+10)

5 - access("EMP"."DEPTNO">="DEPT"."DEPTNO"-10)

filter("EMP"."DEPTNO">="DEPT"."DEPTNO"-10)

合并排序的思路和数据结构中的合并排序算法相似,适合在数据筛选条件有限或者返回结果已经排序的场景中使用。如果本身表中的数据量很大,做Sort-Merge Join就会耗费大量的CPU资源,临时表空间相比来说不是很划算,完全可以通过其他的连接来实现。

相关推荐

甲骨文签署多项大型云协议,其一未来可贡献超300亿美元年收入

IT之家7月1日消息,根据甲骨文Oracle当地时间6月30日向美国证券交易委员会(SEC)递交的FORM8-K文件,该企业在始于2025年6月1日的202...

甲骨文获TEMU巨额合同,后者大部分基础设施将迁移至Oracle云

IT之家6月23日消息,Oracle甲骨文创始人、董事长兼首席技术官LarryEllison(拉里埃里森)在本月早些时候的2025财年第四财季和全财年财报电话会议上表示,Oracle...

Spring Boot 自定义数据源设置,这些坑你踩过吗?

你在使用SpringBoot进行后端开发的过程中,是不是也遇到过这样的问题:项目上线后,数据库连接总是不稳定,偶尔还会出现数据读取缓慢的情况,严重影响了用户体验。经过排查,发现很大一部分原因竟然...

一个开箱即用的代码生成器(一个开箱即用的代码生成器是什么)

今天给大家推荐一个好用的代码生成器,名为renren-generator,该项目附带前端页面,可以很方便的选择我们所需要生成代码的表。首先我们通过git工具克隆下来代码(地址见文末),导入idea。...

低代码建模平台-数据挖掘平台(低代码平台的实现方式)

现在来看一下数据连接。·这里是管理数据连接的空间,点击这里可以新增一个数据连接。·输入连接名称,然后输入url,是通过gdbc的方式去连接的数据库,目前是支持mysql、oracle以及国产数据库达梦...

navicat 17.2.7连接oracle数据库提示加载oracle库失败

系统:macOS15.5navicat版本:navicatpremiumlite17.2.7连接oracle测试报错:加载oracle库失败【解决办法】:放达里面找到程序,显示简介里面勾选“使...

开源“Windows”ReactOS更新:支持全屏应用

IT之家6月17日消息,ReactOS团队昨日(6月16日)在X平台发布系列推文,公布了该系统的最新进展,包括升级Explorer组件,支持全屏应用,从Wine项目引入了...

SSL 推出采用全模拟内置混音技术的模拟调音台Oracle

英国调音台传奇品牌SolidStateLogic宣布推出Oracle——一款采用全模拟内置混音技术的调音台,在紧凑的AWS尺寸机箱内集成了大型调音台的功能。该调音台提供24输入和...

47道网络工程师常见面试题,看看有没有你不会的!

你们好,我的网工朋友。网络工程师面试的时候,都会被问到什么?这个问题其实很泛,一般来说,你肯定要先看明白岗位需求写的是什么。基本上都是围绕公司需要的业务去问的。但不可否认的是,那些最基础的概念,多少也...

汉得信息:发布EBS系统安装启用JWS的高效解决方案

e公司讯,从汉得信息获悉,近日,微软官方宣布InternetExplorer桌面应用程序将于2022年6月15日正式停用。目前大部分客户都是使用IE浏览器打开EBS的Form界面,IE停用后,只能使...

36.9K star ! 推荐一个酷炫低代码开发平台!功能太强!

前言最近在逛github,看看能不能搜罗到一些对自己有帮助的开源软件。不经意间看到一个高star的java开源项目:jeecg-boot。进入在线演示版一看,感叹实在是太牛了!此开源项目不管是给来学习...

Linux新手入门系列:Linux下jdk安装配置

本系列文章是把作者刚接触和学习Linux时候的实操记录分享出来,内容主要包括Linux入门的一些理论概念知识、Web程序、mysql数据库的简单安装部署,希望能够帮到一些初学者,少走一些弯路。注意:L...

手把手教你在嵌入式设备中使用SQLite3

摘要:数据库是用来存储和管理数据的专用软件,使得管理数据更加安全,方便和高效。数据库对数据的管理的基本单位是表(table),在嵌入式linux中有时候它也需要用到数据库,听起来好难,其实就是几个函数...

JAVA语言基础(java语言基础知识)

一、计算机的基本概念什么是计算机?计算机(Computer)全称:电子计算机,俗称电脑。是一种能够按照程序运行、自动高速处理海量数据的现代化智能电子设备。由硬件和软件组成、没有安装过任何软件的计算机称...

再见 Navicat!一款开源的 Web 数据库管理工具!

大家好,我是Java陈序员。在日常的开发工作中,常常需要与各种数据库打交道。而为了提高工作效率,常常会使用一些可视化工具进行操作数据库。今天,给大家介绍一款开源的数据库管理工具,无需下载安装软件,基...

取消回复欢迎 发表评论: