百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术教程 > 正文

oracle实验--探讨Oracle聚簇Cluster(B树聚簇)

mhr18 2024-09-21 18:59 21 浏览 0 评论

概述

Oracle数据表三种基本类型:堆表Heap Table、索引组织表IOT和聚簇表Cluster。在我们日常中,最常用也是适应性最好的一种数据表就是堆表Heap Table。一般在没有特殊性能缺陷和特性要求的情况下,堆表是我们首先的选项。

IOT是一种融合数据到索引结构上的数据表类型。之前已经详细介绍了IOT的结构、特性和适应场景,同时也对段溢出Segment Overflow、逻辑Rowid和Secondary Index等概念进行过阐述。所以今天主要介绍一下聚簇。


01

聚簇Cluster

三种数据表类型中,我们最不常用的结构应该是聚簇。聚簇也是和其他两种数据表差异最大的一种结构类型,最大的区别在于:聚簇是可以单独存在的。

在Oracle存储结构中,我们必须遵循两个概念就是对象和段Segment。我们可以创建很多对象,比如数据表、索引、视图,但是并不是每个对象都会“真刀真枪”的占用存储空间。Oracle空间分配是依据逻辑表空间、段对象、分区和块。只有数据表、索引等对象,才是可以真正使用空间的,分配Segment的。

堆表和索引组织表虽然有差别,但是本质上是类似的。堆表中,索引和数据表是分别的数据段结构,索引段和数据表段保持一致性。而IOT实现了索引和数据表段的合一。数据表的所有内容,依据主键顺序被保存在IOT索引树的叶子节点上。由于数据表内容的特殊性,比如字段过大的情况,都是通过溢出段实现。

而Cluster完全不同,Cluster是一种单独的段结构,或者可以理解为单独的段空间容器。在没有数据表和索引的时候,Cluster段是可以单独存在的。依据一定的规则,如连接键(Join Key),可以将多个数据表数据保存在同一个段中。并且依据一定场景实现快速检索连接。

为什么使用Cluster数据表?最常见的解释是减少关联检索时候进行IO的数量。传统的数据表结构,两个表连接,至少要进行两次数据块的检索。而Cluster过程,由于都是存储在一起(注意:相同Segment),所以只需一次检索。

Cluster进行使用的时候,有两个类型进行选择,分别为B树Cluster和哈希Hash Cluster。两者既有相同的结构,又有细微的差异。


02

实验环境介绍

这里我选择Oracle 11gR2进行实验。

SQL> select * from v$version;


创建专门的用户进行实验。

SQL> create user test identified by test default tablespace users;
SQL> grant resource, connect to test;
SQL> grant create cluster to test;
SQL> grant select any table to test;
SQL> grant select any dictionary to test;

03

B树Cluster实验

Oracle Cluster不是随任何数据表对象创建,而是可以通过SQL语句create cluster来进行创建。

SQL> conn test/test;
SQL> create cluster emp_dept(deptno number) size 600;
SQL> select cluster_name, tablespace_name, cluster_type, key_size from user_clusters;

注意两个问题,一个是创建cluster的过程中我们指定的size 600。这个是用于指定cluster键大致大小,指定之后,就可以实现空间的预留。如果这个取值设置不合理,容易引起Cluster结构的混乱。

另一个问题是tablespace_name,Cluster对象既然包括了tablespace信息,就必然是占用空间的,也必然以segment的形式出现。

SQL> select SEGMENT_TYPE, extents, HEADER_FILE, HEADER_BLOCK, BYTES, BLOCKS from dba_segments where user='TEST' and segment_name='EMP_DEPT';

注意:此时没有创建数据表或者索引,但是cluster segment已经存在出现。下面根据cluster emp_dept创建数据表。

SQL> create table emp(empno number, empname varchar2(10), deptno number) cluster emp_dept(deptno);
SQL> select SEGMENT_TYPE, extents, HEADER_FILE, HEADER_BLOCK, BYTES, BLOCKS from dba_segments where user='TEST' and segment_name='EMP_DEPT';
SQL> select SEGMENT_TYPE, extents, HEADER_FILE, HEADER_BLOCK, BYTES, BLOCKS from dba_segments where user='TEST' and segment_name='EMP';

依托cluster创建数据表的时候,要指定出哪个字段是cluster的key键值。从段结构数据字典中,不能看到数据表的段信息,只有cluster的段信息。从dba_tables中,可以看到数据表成功创建。

SQL> select segment_created from dba_tables where user='TEST' and table_name='EMP';

此时尝试往数据表emp添加数据,是被禁止的。

SQL> insert into emp select empno, ename, deptno from scott.emp;

这里报错是因为使用cluster还需要创建专门的cluster index。为了进行连接测试,先创建第二张数据表,同时创建需要的索引结构。

SQL> create table dept (deptno number primary key, deptname varchar2(10)) cluster emp_dept(deptno);
SQL> select OWNER,TABLESPACE_NAME,CLUSTER_NAME,segment_created from dba_tables where user='TEST' and table_name='DEPT';
SQL> create index idx_emp_dept on cluster emp_dept;

查看索引

SQL> select SEGMENT_TYPE, extents, HEADER_FILE, HEADER_BLOCK, BYTES, BLOCKS from dba_segments where user='TEST' and segment_name in ('EMP_DEPT','IDX_EMP_DEPT');
SQL> select SEGMENT_TYPE, extents, HEADER_FILE, HEADER_BLOCK, BYTES, BLOCKS from dba_segments where user='TEST' and segment_name='EMP';
SQL> select SEGMENT_TYPE, extents, HEADER_FILE, HEADER_BLOCK, BYTES, BLOCKS from dba_segments where user='TEST' and segment_name='DEPT';
--Index元数据信息
SQL> select index_type, table_name, table_type, UNIQUENESS from dba_indexes where user='TEST' and index_name='IDX_EMP_DEPT';

我们创建了两张数据表和一个索引,只有cluster和索引成为了段对象。而且两个数据表都包括保存在了cluster段结构中。

创建索引的过程和普通索引是不同的。我们没有给数据表建索引,而是给cluster对象。从dba_indexes视图中,可以看到差异和不同。

下面插入数据。

SQL> insert into dept select deptno, dname from scott.dept;
SQL> insert into emp select empno, ename, deptno from scott.emp;
SQL> commit;

此时,段结构依然维持一个cluster和一个索引的形态。

SQL> select SEGMENT_TYPE, extents, HEADER_FILE, HEADER_BLOCK, BYTES, BLOCKS from dba_segments where user='TEST' and segment_name='EMP';
SQL> select SEGMENT_TYPE, extents, HEADER_FILE, HEADER_BLOCK, BYTES, BLOCKS from dba_segments where user='TEST' and segment_name='DEPT';
SQL> select SEGMENT_TYPE, extents, HEADER_FILE, HEADER_BLOCK, BYTES, BLOCKS from dba_segments where user='TEST' and segment_name in ('EMP_DEPT','IDX_EMP_DEPT');

使用cluster最大的好处在于连接,我们查看一下连接情况下的执行计划。

SQL> explain plan for select * from emp a, dept b where a.deptno=b.deptno;
SQL> select * from table(dbms_xplan.display);

cluster本质上就是一个容器,如果需要删除cluster,需要将其中数据表对象全部删除之后,方可执行。或者使用including tables子句。

SQL> drop cluster emp_dept;
SQL> drop cluster emp_dept including tables;



篇幅有限,今天主要分享的是B树聚簇,也是简单的一种聚簇形式。后面再探讨下Hash Cluster的相关内容,感兴趣的朋友可以关注一下~


相关推荐

甲骨文签署多项大型云协议,其一未来可贡献超300亿美元年收入

IT之家7月1日消息,根据甲骨文Oracle当地时间6月30日向美国证券交易委员会(SEC)递交的FORM8-K文件,该企业在始于2025年6月1日的202...

甲骨文获TEMU巨额合同,后者大部分基础设施将迁移至Oracle云

IT之家6月23日消息,Oracle甲骨文创始人、董事长兼首席技术官LarryEllison(拉里埃里森)在本月早些时候的2025财年第四财季和全财年财报电话会议上表示,Oracle...

Spring Boot 自定义数据源设置,这些坑你踩过吗?

你在使用SpringBoot进行后端开发的过程中,是不是也遇到过这样的问题:项目上线后,数据库连接总是不稳定,偶尔还会出现数据读取缓慢的情况,严重影响了用户体验。经过排查,发现很大一部分原因竟然...

一个开箱即用的代码生成器(一个开箱即用的代码生成器是什么)

今天给大家推荐一个好用的代码生成器,名为renren-generator,该项目附带前端页面,可以很方便的选择我们所需要生成代码的表。首先我们通过git工具克隆下来代码(地址见文末),导入idea。...

低代码建模平台-数据挖掘平台(低代码平台的实现方式)

现在来看一下数据连接。·这里是管理数据连接的空间,点击这里可以新增一个数据连接。·输入连接名称,然后输入url,是通过gdbc的方式去连接的数据库,目前是支持mysql、oracle以及国产数据库达梦...

navicat 17.2.7连接oracle数据库提示加载oracle库失败

系统:macOS15.5navicat版本:navicatpremiumlite17.2.7连接oracle测试报错:加载oracle库失败【解决办法】:放达里面找到程序,显示简介里面勾选“使...

开源“Windows”ReactOS更新:支持全屏应用

IT之家6月17日消息,ReactOS团队昨日(6月16日)在X平台发布系列推文,公布了该系统的最新进展,包括升级Explorer组件,支持全屏应用,从Wine项目引入了...

SSL 推出采用全模拟内置混音技术的模拟调音台Oracle

英国调音台传奇品牌SolidStateLogic宣布推出Oracle——一款采用全模拟内置混音技术的调音台,在紧凑的AWS尺寸机箱内集成了大型调音台的功能。该调音台提供24输入和...

47道网络工程师常见面试题,看看有没有你不会的!

你们好,我的网工朋友。网络工程师面试的时候,都会被问到什么?这个问题其实很泛,一般来说,你肯定要先看明白岗位需求写的是什么。基本上都是围绕公司需要的业务去问的。但不可否认的是,那些最基础的概念,多少也...

汉得信息:发布EBS系统安装启用JWS的高效解决方案

e公司讯,从汉得信息获悉,近日,微软官方宣布InternetExplorer桌面应用程序将于2022年6月15日正式停用。目前大部分客户都是使用IE浏览器打开EBS的Form界面,IE停用后,只能使...

36.9K star ! 推荐一个酷炫低代码开发平台!功能太强!

前言最近在逛github,看看能不能搜罗到一些对自己有帮助的开源软件。不经意间看到一个高star的java开源项目:jeecg-boot。进入在线演示版一看,感叹实在是太牛了!此开源项目不管是给来学习...

Linux新手入门系列:Linux下jdk安装配置

本系列文章是把作者刚接触和学习Linux时候的实操记录分享出来,内容主要包括Linux入门的一些理论概念知识、Web程序、mysql数据库的简单安装部署,希望能够帮到一些初学者,少走一些弯路。注意:L...

手把手教你在嵌入式设备中使用SQLite3

摘要:数据库是用来存储和管理数据的专用软件,使得管理数据更加安全,方便和高效。数据库对数据的管理的基本单位是表(table),在嵌入式linux中有时候它也需要用到数据库,听起来好难,其实就是几个函数...

JAVA语言基础(java语言基础知识)

一、计算机的基本概念什么是计算机?计算机(Computer)全称:电子计算机,俗称电脑。是一种能够按照程序运行、自动高速处理海量数据的现代化智能电子设备。由硬件和软件组成、没有安装过任何软件的计算机称...

再见 Navicat!一款开源的 Web 数据库管理工具!

大家好,我是Java陈序员。在日常的开发工作中,常常需要与各种数据库打交道。而为了提高工作效率,常常会使用一些可视化工具进行操作数据库。今天,给大家介绍一款开源的数据库管理工具,无需下载安装软件,基...

取消回复欢迎 发表评论: