Oracle压缩黑科技(一)—基础表压缩
mhr18 2024-09-20 20:55 21 浏览 0 评论
原文链接 https://www.red-gate.com/simple-talk/sql/oracle/compression-oracle-basic-table-compression/
译者 周天鹏
在关于Oracle压缩的这一系列文章中,我们会研究下传统Oracle数据库系统的各类压缩方式,这意味着该系列文章的目录结构大概是:
1. 基础表压缩
2. OLTP表压缩
3. 索引压缩
但是,不讨论Exadata的hybrid columnar compression (HCC)。
在这三种压缩技术中,索引压缩和基础表压缩是产品自带的核心组件,但是,OLTP压缩需要独立的“Advanced Compression Option (ACO)” license授权。再第一篇文章中,我们先用基础表压缩造一些数据,把对数据更新删除的问题留到第二篇文章中,最后基于前两篇的铺垫,我们再研究下OLTP的压缩。索引压缩单独留在第四、第五篇中探讨。
本文主要目的是解答一些关于表压缩相关的经常被问到的问题。
基础表压缩何时起作用?
人们经常问道,“我如何造压缩数据”,“Oracle如何解压这些数据块”,“压缩对性能会造成什么影响”,还有一个人们在使用任何新特性前都会问的问题“有啥不为人知的副作用吗?”
回答第一个问题最简单的方法就是通过一个实际例子。这里有5条SQL,跑完后我们先收集表的统计信息,然后查一下表里有多少数据块和一些其他相当信息。
-- 1. Baseline CTAS
create table t1
as
select * from all_objects where rownum <= 50000;
-- 2. CTAS with basic compression enabled
create table t1 compress basic
as
select * from all_objects where rownum <= 50000;
-- 3. Normal insert into empty table defined as compressed
create table t1 compress basic
as
select * from all_objects where rownum = 0;
insert into t1 select * from all_objects where rownum <= 50000
-- 4. Direct path insert into empty table defined as compressed
create table t1 compress basic
as
select * from all_objects where rownum = 0;
insert /*+ append */ into t1 select * from all_objects where rownum <= 50000
-- 5. CTAS without compression, then change to compressed
create table t1
as
select * from all_objects where rownum <= 50000;
alter table t1 compress basic;
alter table t1 move
每一条SQL执行完我都会运行下面的SQL查询数据块的信息:
select blocks, pct_free , compression, compress_for
from user_tables
where table_name = 'T1';
当然也有其他方法,我们可以将表空间定义为压缩的,这样在里面创建的所有表就会被默认进行压缩;我们还可以将分区表的分区或者子分区进行压缩;我们甚至可以将分区表定义为默认压缩,这样新增的分区就都是压缩的了。
我用下面这个图表总结了上述sql代码的结果:
test5有两个结果,一个是alter table move之前的,一个是之后的
当我在CTAS(create table as select)加了压缩选项时, Oracle自动将pctfree置为0 —— 这将数据块的数量显著减少,只用了189个数据块。pctfree为0意味着Oracle认为这张表将会变成read only的。但是,pctfree当然也可以设置为一个非空的值,这在后面的章节会讲。
在第三第四个测试中,我创建了一个启用了压缩的空表,然后插入数据。正如你所看到的,只有使用direct path insert,插入的数据才会被压缩。普通的insert操作并不会压缩数据。(insert后的数据块644个,相比CTAS 714个要少一些的原因是因为pctfree从10变为了0)
最后一个测试告诉我们,将表从非压缩改为压缩之后,对现存的数据并没有影响。如果你想将未压缩的数据进行压缩,需要先改变表的定义,然后move表。但是,move后需要立即重建表上的所有索引。
压缩原理并非如我们所想
Oracle如何进行压缩的呢?实际上,Oracle并不会进行压缩。他做的仅仅是块级别的深度复制。想象一下,你在一个数据块里有下面三行数据:
(‘XXXX’, ‘abcdef’, 254.32, ‘CLOSED’)
(‘XXXX’, ‘pqrstu’, 17.12, ‘CLOSED’)
(‘AAAA’, ‘abcdef’, 99.99, ‘CLOSED’)
Oracle会发现‘XXXX’出现了两次,‘abcdef’出现了两次,‘CLOSED’出现了三次。这样,就可以用这个块里重复的值创建一个字典表。压缩后的数据如下
T1 (‘XXXX’)
T2 (‘abcdef’)
T3 (‘CLOSED’)
(T1, T2, 254.32, T3)
(T1, ‘pqrstu’, 17.12, T3)
(‘AAAA’, T2, 99.99, T3)
其实,Oracle比这还要聪明,它可以重新排列块中的字段顺序,使得多个字段可以用一个标志代替。在我们的例子中,三行数据都有T1和T3。Oracle可以重排列这些字段,让这些标志尽可能的在一块,以至于可以用创建一个标志来代替两个标志的组合。最终数据会变成这样:
T1 (‘XXXX’, T2) -- 这是一个由数值和标志组合成的标志
T2 (‘CLOSED’)
T3 (‘abcdef’)
(T1, T3, 254.32) -- 注意这行只有了三列
(T1, ‘pqrstu’, 17.12) -- 同上
(‘AAAA’, T2, T3, 99.99)
让我们通过dump数据块里的数据来更进一步观察压缩的内部实现原理。这里是一个压缩表中的数据块中的第一个片段:
perm_9ir2[4]={ 2 0 1 3 }
这个表有4个数据块,但是对于这个块,Oracle重新排列了字段的顺序,意思是:字段0放在了第二位,字段1在第三位,字段2在第一位,字段3在第四位。
0x24:pti[0] nrow=65 offs=0
0x28:pti[1] nrow=400 offs=65
如上,这是数据块里的两个“表”,第一个是存放标志的“表”(其实就是字典表),有65个标志,在块的行目录中从0开始。第二个是真正的“表”,有400行,在块的行目录中从65开始。这意味着这个块的行目录一共有465个条目。
如果我们从第二个“表”(真正的数据表,而不是字典表)开始看,我们会发现这和普通的堆表中的数据块dump出来的一行没什么两样。但这里有一些特殊的点需要注意。
tab 1, row 0, @0x1b28
tl: 5 fb: --H-FL-- lb: 0x0 cc: 4
col 0: [ 4] 41 41 41 41
col 1: [10] 41 41 41 41 41 41 41 41 41 41
col 2: [ 2] c1 02
col 3: [10] 20 20 20 20 20 20 20 20 20 31
bindmp: 2c 00 01 04 31
基于列的长度(方括号中的数据),行的长度是26个字节(4+10+2+10),加上四个列4个字节 和 flag byte(fb:),lock byte(lb:),column count(cc:)每个1字节 - 但总的实际长度(tl:)只有5字节。而且最后一行也展示了这5个字节实际的数据。这5个字节分别是flag byte (0x2c = ‘–H-FL’), lock byte和存储的列数量。然后剩下2字节告诉我们有一个列是一个标志代表4个连续的值,而且我们需要到字典表中找0x31号标志。接下来让我们看下字典表中的49行(0x31):
tab 0, row 49, @0x1ed0
tl: 19 fb: --H-FL-- lb: 0x0 cc: 4
col 0: [ 4] 41 41 41 41
col 1: [10] 41 41 41 41 41 41 41 41 41 41
col 2: [ 2] c1 02
col 3: [10] 20 20 20 20 20 20 20 20 20 31
bindmp: 00 08 04 36 40 ca c1 02 d2 20 20 20 20 20 20 20 20 20 31
这个标志看起来几乎和行一样 - 但是标志的总长是19字节。所以我们看下dump出来的数据。前两个字节告诉我们这个标志在这个块里用了8次。下一个字节告诉我们标志中有4个列,通过一些编码,剩下的两个字节告诉我们这个标志的前两个字段的值实际存储在在0x36(54)和0x40(64)号标志中。后两个字段直接就是实际的数据了。
所以,通过我们的方法,从行目录到行、标志,我们可以扩展一个5字节的条目到一个完整的26字节的行。
通过我们对数据块dump出的数据进行跟踪,这里还有许多知识值得学习。
1. Oracle不会解压这些数据,他只是根据你的需求,用字典表和数据表中的数据将行重构出来。
2. 重构行的时候很可能会消耗一些额外的CPU,在做全表扫描时将尤为明显。
3. 有一个副作用,为了能重构行,Oracle必须持有某些块一段时间。所以你可能发现你的sql很少发生“consistent gets – examination”的等待,因为大部分时间花在了“cache buffers chains”的latch上面。
总 结
依然有很多关于压缩的副作用值得一提,尤其是删除和更新表的时候,这也讲引导着我们去实现OLTP的压缩 - 将来的文章会讲。
我们从这第一篇文章中发现看到了:
1. 基础压缩只有在direct path inserts时有效,普通的DML不会压缩数据。
2. Oracle会默认把压缩表的PCTFREE置为0,这也很好的表明,Oracle认为建表后你不会再修改数据。
3. 基础表压缩仅仅是把重复的值进行深度复制,但Oracle足够聪明来最小化数据占用的空间。
4. 这种深度复制机制意味着Oracle不需要解压数据,只需要把块cache在buffer cache中然后在PGA里重构行即可,该操作属于CPU密集型。
相关推荐
- jdk17安装和配置环境变量(jdk安装步骤环境变量配置)
-
简单介绍JDK17是Java的一个长期支持(LTS)版本,于2021年9月发布。作为LTS版本,它将获得Oracle的长期支持,这意味着会获得安全更新和错误修复,直到2...
- jdk8安装和配置环境变量(jdk8配置环境变量win10)
-
简单介绍JDK8是Java开发工具包的一个重大版本,于2014年3月发布。它引入了许多重要的新特性,极大地改进了Java编程的体验,并提高了代码的效率和可读性。总结JDK8是一...
- Java开发环境的准备流程!(java开发环境的准备流程有哪些)
-
准备开发环境工欲善其事,必先利其器。在学习本书的技术内容之前,应先将开发环境搭建好。本书所涉及的基础环境将在本章准备,包括JDK、IntelliJIDEA和Maven。如果读者对这些环境较为熟悉,可...
- skywalking-全链路跟踪(链路追踪sleuth)
-
一、概述1、skywalking简介SkyWalking是一款广受欢迎的国产APM(ApplicationPerformanceMonitoring,应用性能监控)产品,主要针对微服务、Clou...
- Oracle项目管理系统之成本状态跟踪
-
卷首语成本费用管理模块功能分为公司级、项目级两个层级,其中公司级功能包括概预算管理、概预算定额管理、预算模板管理,以及控制估算管理等功能。费用与成本成本费用管理主要是为了合理利用资金资源,控制企业的成...
- 从入门到精通,Java最全学习路线(java自学路线)
-
最近好多小伙伴询问,该如何学习java?那些视频适合零基础学习呢?大多数都是一些刚入门的新手,还不了解这个行业,也不知道从何学起,开始的时候非常迷茫,在这给大家整理出一些学习路线。Java学习路线在这...
- SPARC M7最新技术 甲骨文首度在台发表
-
甲骨文首度在台发表SPARCM7最新技术,宣布推出全新SPARC系统產品系列,採用革命性的32内核、256执行绪SPARCM7微处理器。这套SPARC系统提供:先进的入侵防护和加密的Securit...
- 轻量化的企业级OLAP方案2(轻量化ar)
-
上一篇文章讲了一个轻量化的企业级OLAP方案,这一篇文章继续介绍另外一个方案。方案2:Greenplum1Greenplum介绍1.1Greenplum概念Greenplum数据库是一种基于Po...
- 时序数据库在水电站领域的应用(时序数据库优缺点)
-
大家好,上期经过了王宏志教授对数据库前沿领域的介绍,不知道小伙伴们是否对数据库领域有了更深的认识呢,本期让我们回归时序数据库,再来聊一聊时序数据库在水电站领域的应用。本文仅代表个人观点,如有偏颇之处,...
- 数据库SQL引擎比较(数据库引擎有哪些,有什么区别)
-
数据库SQL引擎的典型工作机制及详细分析如下,涵盖查询处理全流程中的核心机制与实际案例:一、SQL引擎核心处理流程1.解析与校验阶段词法/语法解析:SQL语句被拆解为Token序列,构建...
- Ubuntu系统密码(root密码)的修改方法
-
本文介绍在Linux系统的Ubuntu电脑中,修改账户用户密码(同时也修改了root用户密码)的方法。首先,如果此时处于登录页面(也就是意识到自己忘记密码的那个页面),就先点击右上角的关闭按钮...
- TablePlus:一个跨平台的数据库管理工具
-
TablePlus是一款现代化的跨平台(Window、Linux、macOS、iOS)数据库管理工具,提供直观的界面和强大的功能,可以帮助用户轻松管理和操作数据库。TablePlus免费版可以永久...
- 云满足用户对通过单一视图了解整体运营和数据的需求
-
ZD至顶网软件频道消息:云在简化IT和业务的同时也带来了新问题,这很有趣,不是吗?毫无疑问,云大幅降低了企业运行基础设施和应用的复杂性和成本;但您仍然面临一个老生常谈的问题——孤岛,只不过这次是在云...
- SQL_TOP(显示数据条数)(sqlserver显示查询的行数)
-
(8)SELECT(9)DISTINCT(11)<topNum><selectlist>(1)FROM[left_table](3)<join_type>...
- php搭建小型部门网站(php构建网站)
-
熟悉前端html,js,css,后端熟悉php,python,java只能称得上一般,还有很多坑待踩。鉴于所学很杂,决定利用对业务的熟悉来搞一个部门网站来简化大家的工作流程。初步设计方案后端用p...
你 发表评论:
欢迎- 一周热门
- 最近发表
- 标签列表
-
- oracle位图索引 (74)
- oracle批量插入数据 (65)
- oracle事务隔离级别 (59)
- oracle 空为0 (51)
- oracle主从同步 (55)
- oracle 乐观锁 (51)
- redis 命令 (78)
- php redis (88)
- redis 存储 (66)
- redis 锁 (69)
- 启动 redis (66)
- redis 时间 (56)
- redis 删除 (67)
- redis内存 (57)
- redis并发 (52)
- redis 主从 (69)
- redis 订阅 (51)
- redis 登录 (54)
- redis 面试 (58)
- 阿里 redis (59)
- redis 搭建 (53)
- redis的缓存 (55)
- lua redis (58)
- redis 连接池 (61)
- redis 限流 (51)