百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术教程 > 正文

Oracle表访问方法-索引扫描(oracle查询表索引sql)

mhr18 2024-10-12 04:39 28 浏览 0 评论

索引扫描访问方法

索引建立在表中的一个或者多个列或者是列的表达式上,将列值和行编号(rowid)一起存储。行编号是一个用来唯一标记表中行的伪列。它包含两个地址,其一为指向数据表中包含该行的块所存放数据文件的地址,另一个是可以直接定位到数据行自身的这一行在数据块中的地址。

rowid转换物理文件编号file_id:dbms_rowid.rowid_to_absolute_fno(rowid,user,'表名')

rowid转换物理块编号block_no:dbms_rowid.rowid_block_number(rowid);

rowid转换物理数据行编号:dbms_rowid.rowid_row_number(rowid)

索引结构

索引的高度是指第一个分支块(也就是数据块)到叶子块的分支层级数。叶子分支包含排序后的索引对象的值和行编号。

随着新行加入表中,新的索引条目也会增加到块中,直到新的条目再也加不进去为止。此时oracle就会分配两个新的索引块并将所有索引条目加入这两个新的叶子块中,之前被填满的那个地址(relative block address,RBA)和一个表明相关叶子块中最低索引值(即排序中的最小值)的值组成。利用根数据块中的这个信息,oracle就可以搜索索引以找到存有所需值的特定叶子块。目前为止,该索引高度为2,blevel为1。

索引扫描类型

索引扫描类型,包括索引范围扫描、索引唯一扫描、索引全扫描、索引跳跃扫描以及索引快速扫描。

聚簇因子,索引的聚簇因子向优化器表名了具有同样索引值的数据行是不是存放在同一个或连续的一系列数据块中,或者数据行是否被分散存放在表的多个数据块中。聚簇因子是通过每次当前行的块编号与前一行的块编号不同的时候对计数器加1来计算的。

索引唯一扫描

当谓语中包含使用union或者primary key索引的列作为条件的时候就会选用索引唯一扫描。这种类型的索引能够保证对于某个特定的值只返回一行数据。

在这种情况下,索引结构将会被从根到叶子进行遍历直到某个条目,取出其行编号,然后使用这个行号来访问包含这一行的表数据块。计划中table access by index rowid步骤表明对于表数据块的访问。除非某特定情况,例如数据行是链式的或者包含存储在别处的大对象(LOB)。需要访问的数据块数总是等于索引的高度加一。

索引唯一扫描示例:

SQL> set autot traceonly exp
SQL> select * from employees where employee_id = 100;
Execution Plan
----------------------------------------------------------
Plan hash value: 1833546154
---------------------------------------------------------------------------------------------
| Id | Operation | Name | Rows | Bytes | Cost (%CPU)| Time |
---------------------------------------------------------------------------------------------
| 0 | SELECT STATEMENT | | 1 | 69 | 1 (0)| 00:00:01 |
| 1 | TABLE ACCESS BY INDEX ROWID| EMPLOYEES | 1 | 69 | 1 (0)| 00:00:01 |
|* 2 | INDEX UNIQUE SCAN | EMP_EMP_ID_PK | 1 | | 0 (0)| 00:00:01 |
---------------------------------------------------------------------------------------------
Predicate Information (identified by operation id):
---------------------------------------------------
 2 - access("EMPLOYEE_ID"=100)

因为在谓语中用了主键employee_id。

索引范围扫描

当谓语中包含返回一定范围数据的条件时就会选用索引范围扫描。所指定条件可以是“<>”,“like”,“between”甚至等号“=”等运算符号。

示例如下:

SQL> select * from employees where department_id=60;
Execution Plan
----------------------------------------------------------
Plan hash value: 2056577954
-------------------------------------------------------------------------------------------------
| Id | Operation | Name | Rows | Bytes | Cost (%CPU)| Time |
-------------------------------------------------------------------------------------------------
| 0 | SELECT STATEMENT | | 5 | 345 | 2 (0)| 00:00:01 |
| 1 | TABLE ACCESS BY INDEX ROWID| EMPLOYEES | 5 | 345 | 2 (0)| 00:00:01 |
|* 2 | INDEX RANGE SCAN | EMP_DEPARTMENT_IX | 5 | | 1 (0)| 00:00:01 |
-------------------------------------------------------------------------------------------------
Predicate Information (identified by operation id):
---------------------------------------------------
 2 - access("DEPARTMENT_ID"=60)

当选择了索引范围扫描时,执行计划中的谓语信息将会示出用来访问索引的条件。

在上面例子中,计划中的第2步上有个星号。这是一个表明在计划的下面列出了这一步的谓语信息的标志。在那里,可以看到一个条目表明索引条目访问通过条件department_id=60来确认。

索引范围扫描的最后一个好处在于,它可以使用一个升序排列的索引(默认值)来返回降序排列的数据行。这种情况可能发生在查询中包含有索引列上的order by 子句的时候。

示例如下:

SQL> select * from employees
 2 where department_id=90 or department_id=100
 3 order by department_id desc;
Execution Plan
----------------------------------------------------------
Plan hash value: 3707994525
---------------------------------------------------------------------------------------------------
| Id | Operation | Name | Rows | Bytes | Cost (%CPU)| Time |
---------------------------------------------------------------------------------------------------
| 0 | SELECT STATEMENT | | 9 | 621 | 2 (0)| 00:00:01 |
| 1 | INLIST ITERATOR | | | | | |
| 2 | TABLE ACCESS BY INDEX ROWID | EMPLOYEES | 9 | 621 | 2 (0)| 00:00:01 |
|* 3 | INDEX RANGE SCAN DESCENDING| EMP_DEPARTMENT_IX | 9 | | 1 (0)| 00:00:01 |
---------------------------------------------------------------------------------------------------

DESCENDING表明索引降序排列行数据。上面例子中,索引条目实际上被以相反的顺序读取了。

索引全扫描

在好几种情况下都会选择索引全扫描,包括:

  1. 当没有谓语但是所需获取列的列表可以通过其中一列的索引来获得。
  2. 谓语中包含一个谓语条件,该谓语引用的列在索引中为非引导列。
  3. 数据可以通过一个排过顺序的索引来获取并且会省去单独排序的步骤。

第一点的示例:

SQL> select email from employees;
Execution Plan
----------------------------------------------------------
Plan hash value: 2196514524
---------------------------------------------------------------------------------
| Id | Operation | Name | Rows | Bytes | Cost (%CPU)| Time |
---------------------------------------------------------------------------------
| 0 | SELECT STATEMENT | | 107 | 856 | 1 (0)| 00:00:01 |
| 1 | INDEX FULL SCAN | EMP_EMAIL_UK | 107 | 856 | 1 (0)| 00:00:01 |

第2点示例:

SQL> select first_name,last_name from employees where first_name like 'A%';
Execution Plan
----------------------------------------------------------
Plan hash value: 2228653197
--------------------------------------------------------------------------------
| Id | Operation | Name | Rows | Bytes | Cost (%CPU)| Time |
--------------------------------------------------------------------------------
| 0 | SELECT STATEMENT | | 3 | 45 | 1 (0)| 00:00:01 |
|* 1 | INDEX FULL SCAN | EMP_NAME_IX | 3 | 45 | 1 (0)| 00:00:01 |
--------------------------------------------------------------------------------
Predicate Information (identified by operation id):
---------------------------------------------------
 1 - access("FIRST_NAME" LIKE 'A%')
 filter("FIRST_NAME" LIKE 'A%')

上面示例中,first_name,last_name是组合索引,并且last_name为引导列,而first_name为非引导列。

SQL> select * from employees order by employee_id;
Execution Plan
----------------------------------------------------------
Plan hash value: 2186312383
---------------------------------------------------------------------------------------------
| Id | Operation | Name | Rows | Bytes | Cost (%CPU)| Time |
---------------------------------------------------------------------------------------------
| 0 | SELECT STATEMENT | | 107 | 7383 | 3 (0)| 00:00:01 |
| 1 | TABLE ACCESS BY INDEX ROWID| EMPLOYEES | 107 | 7383 | 3 (0)| 00:00:01 |
| 2 | INDEX FULL SCAN | EMP_EMP_ID_PK | 107 | | 1 (0)| 00:00:01 |
---------------------------------------------------------------------------------------------

上面提示,以employee_id排序。

在查询字段列表中所有字段都是索引条目的一部分的时候,就能够完全跳过访问表的步骤。

另外可以用索引全扫描快速查询索引列的最大最小值,如下:

SQL> select max(department_id) from employees;
Execution Plan
----------------------------------------------------------
Plan hash value: 613773769
------------------------------------------------------------------------------------------------
| Id | Operation | Name | Rows | Bytes | Cost (%CPU)| Time |
------------------------------------------------------------------------------------------------
| 0 | SELECT STATEMENT | | 1 | 3 | 1 (0)| 00:00:01 |
| 1 | SORT AGGREGATE | | 1 | 3 | | |
| 2 | INDEX FULL SCAN (MIN/MAX)| EMP_DEPARTMENT_IX | 1 | 3 | 1 (0)| 00:00:01 |
------------------------------------------------------------------------------------------------

索引跳跃扫描

当谓语中包含位于索引中非引导列上的条件,并且引导列的值是唯一的时候会选择索引跳跃扫描。早期版本中,如果一个谓语使用了索引中的非引导列,则该索引不能被选用。跳跃扫描通过逻辑上将多个列的索引分解为多个较小的子索引来实现。逻辑子索引的数目有索引引导列中唯一值的个数决定。引导列中唯一值的数目越多,所需要建立的逻辑索引页越多。

对于那些有组合索引的大型表而言,索引跳跃式扫描特性可以提供一个快速访问,即使索引的第一列没有在限制条件中使用。

oracle的优化器(这里指的是cbo)能对查询应用index skip scans至少要有几个条件:

  1. 优化器认为是合适的.
  2. 索引中的前导列的唯一值的数量能满足一定的条件.
  3. 优化器要知道前导列的值分布(通过分析/统计表得到)
  4. 合适的sql语句
SQL> create table test
 2 as 
 3 select decode(mod(rownum,2), 0, 1, 2 ) a,
 4 rownum-1 b,
 5 rownum-2 c,
 6 rownum-3 d,
 7 rownum-4 e
 8 from all_objects
 9 /
Table created.
SQL> set autotrace off
SQL> select distinct a from test;
 A
----------
 1
 2

索引前导列唯一值较少。

SQL> create index test_idx on test(a,b,c);
Index created.
SQL> analyze table test compute statistics
 2 for table
 3 for all indexes
 4 for all indexed columns;
Table analyzed.
SQL> set autot traceon exp
SQL> select * from test where b=99;
Execution Plan
----------------------------------------------------------
Plan hash value: 2705879578
----------------------------------------------------------------------------------------
| Id | Operation | Name | Rows | Bytes | Cost (%CPU)| Time |
----------------------------------------------------------------------------------------
| 0 | SELECT STATEMENT | | 1 | 25 | 4 (0)| 00:00:01 |
| 1 | TABLE ACCESS BY INDEX ROWID| TEST | 1 | 25 | 4 (0)| 00:00:01 |
|* 2 | INDEX SKIP SCAN | TEST_IDX | 1 | | 3 (0)| 00:00:01 |
----------------------------------------------------------------------------------------
Predicate Information (identified by operation id):
---------------------------------------------------
 2 - access("B"=99)
 filter("B"=99)

索引里面的前导列的唯一值的个数将会影响优化器是否选择跳跃式索引扫描。

索引快速扫描

当优化器选择索引快速全扫描的时候,所有索引块都将通过多块读取来进行读取。这种索引类型的索引扫描是用来在查询列表中所有字段都包含在索引中并且索引中至少有一列具有非空约束时替代全表扫描的。

扫描索引中的所有的数据块,与 index full scan很类似,但是一个显著的区别就是它不对查询出的数据进行排序,即数据不是以排序顺序被返回。在这种存取方法中,可以使用多块读功能,也可以使用并行读入,以便获得最大吞吐量与缩短执行时间。

SQL> set autot traceon exp
SQL> alter table employees modify (email null);
Table altered.
SQL> select email from employees;
Execution Plan
----------------------------------------------------------
Plan hash value: 1445457117
-------------------------------------------------------------------------------
| Id | Operation | Name | Rows | Bytes | Cost (%CPU)| Time |
-------------------------------------------------------------------------------
| 0 | SELECT STATEMENT | | 107 | 856 | 3 (0)| 00:00:01 |
| 1 | TABLE ACCESS FULL| EMPLOYEES | 107 | 856 | 3 (0)| 00:00:01 |
-------------------------------------------------------------------------------
SQL> alter table employees modify(email not null);
Table altered.
SQL> select /*+index_ffs(a EMP_EMAIL_UK)*/email
 2 from EMPLOYEES a where email like 'D%';
Execution Plan
----------------------------------------------------------
Plan hash value: 1103687806
-------------------------------------------------------------------------------------
| Id | Operation | Name | Rows | Bytes | Cost (%CPU)| Time |
-------------------------------------------------------------------------------------
| 0 | SELECT STATEMENT | | 6 | 48 | 2 (0)| 00:00:01 |
|* 1 | INDEX FAST FULL SCAN| EMP_EMAIL_UK | 6 | 48 | 2 (0)| 00:00:01 |
-------------------------------------------------------------------------------------

上面例子说明,索引快速扫描运算为了被选择是如何依赖于非空约束的,如果没有这个约束,将会选择全表扫描运算。

相关推荐

订单超时自动取消业务的 N 种实现方案,从原理到落地全解析

在分布式系统架构中,订单超时自动取消机制是保障业务一致性的关键组件。某电商平台曾因超时处理机制缺陷导致日均3000+订单库存锁定异常,直接损失超50万元/天。本文将从技术原理、实现细节、...

使用Spring Boot 3开发时,如何选择合适的分布式技术?

作为互联网大厂的后端开发人员,当你满怀期待地用上SpringBoot3,准备在项目中大显身手时,却发现一个棘手的问题摆在面前:面对众多分布式技术,究竟该如何选择,才能让SpringBoot...

数据库内存爆满怎么办?99%的程序员都踩过这个坑!

你的数据库是不是又双叒叕内存爆满了?!服务器监控一片红色警告,老板在群里@所有人,运维同事的电话打爆了手机...这种场景是不是特别熟悉?别慌!作为一个在数据库优化这条路上摸爬滚打了10年的老司机,今天...

springboot利用Redisson 实现缓存与数据库双写不一致问题

使用了Redisson来操作Redis分布式锁,主要功能是从缓存和数据库中获取商品信息,以下是针对并发时更新缓存和数据库带来不一致问题的解决方案1.基于读写锁和删除缓存策略在并发更新场景下,...

外贸独立站数据库炸了?对象缓存让你起死回生

上周黑五,一个客户眼睁睁看着服务器CPU飙到100%——每次页面加载要查87次数据库。这让我想起2024年Pantheon的测试:Redis缓存能把WooCommerce查询速度提升20倍。跨境电商最...

手把手教你在 Spring Boot3 里纯编码实现自定义分布式锁

为什么要自己实现分布式锁?你是不是早就受够了引入各种第三方依赖时的繁琐?尤其是分布式锁这块,每次集成Redisson或者Zookeeper,都得额外维护一堆配置,有时候还会因为版本兼容问题头疼半...

如何设计一个支持百万级实时数据推送的WebSocket集群架构?

面试解答:要设计一个支持百万级实时数据推送的WebSocket集群架构,需从**连接管理、负载均衡、水平扩展、容灾恢复**四个维度切入:连接层设计-**长连接优化**:采用Netty或Und...

Redis数据结构总结——面试最常问到的知识点

Redis作为主流的nosql存储,面试时经常会问到。其主要场景是用作缓存,分布式锁,分布式session,消息队列,发布订阅等等。其存储结构主要有String,List,Set,Hash,Sort...

skynet服务的缺陷 lua死循环

服务端高级架构—云风的skynet这边有一个关于云风skynet的视频推荐给大家观看点击就可以观看了!skynet是一套多人在线游戏的轻量级服务端框架,使用C+Lua开发。skynet的显著优点是,...

七年Java开发的一路辛酸史:分享面试京东、阿里、美团后的心得

前言我觉得有一个能够找一份大厂的offer的想法,这是很正常的,这并不是我们的饭后谈资而是每个技术人的追求。像阿里、腾讯、美团、字节跳动、京东等等的技术氛围与技术规范度还是要明显优于一些创业型公司...

mysql mogodb es redis数据库之间的区别

1.MySQL应用场景概念:关系型数据库,基于关系模型,使用表和行存储数据。优点:支持ACID事务,数据具有很高的一致性和完整性。缺点:垂直扩展能力有限,需要分库分表等方式扩展。对于复杂的查询和大量的...

redis,memcached,nginx网络组件

1.理解阻塞io,非阻塞io,同步io,异步io的区别2.理解BIO和AIO的区别io多路复用只负责io检测,不负责io操作阻塞io中的write,能写多少是多少,只要写成功就返回,譬如准备写500字...

SpringBoot+Vue+Redis实现验证码功能

一个小时只允许发三次验证码。一次验证码有效期二分钟。SpringBoot整合Redis...

AWS MemoryDB 可观测最佳实践

AWSMemoryDB介绍AmazonMemoryDB是一种完全托管的、内存中数据存储服务,专为需要极低延迟和高吞吐量的应用程序而设计。它与Redis和Memcached相似,但具有更...

从0构建大型AI推荐系统:实时化引擎从工具到生态的演进

在AI浪潮席卷各行各业的今天,推荐系统正从幕后走向前台,成为用户体验的核心驱动力。本文将带你深入探索一个大型AI推荐系统从零起步的全过程,揭示实时化引擎如何从单一工具演进为复杂生态的关键路径。无论你是...

取消回复欢迎 发表评论: