百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术教程 > 正文

Oracle SQL高级分组用法实战(oracle高级分组函数)

mhr18 2024-10-04 17:18 22 浏览 0 评论

oracle高级分组指的是group by紧跟后面的函数如:

rollup与cube

group by的cube扩展

1. 先看一下ROLLUP的数据统计效果

1)创建测试表group_test

SECOOLER@ora11g> create table group_test (group_id int, job varchar2(10), name varchar2(10), salary int);
Table created.

2)初始化数据

insert into group_test values (10,'Coding', 'Bruce',1000);
insert into group_test values (10,'Programmer','Clair',1000);
insert into group_test values (10,'Architect', 'Gideon',1000);
insert into group_test values (10,'Director', 'Hill',1000);
insert into group_test values (20,'Coding', 'Jason',2000);
insert into group_test values (20,'Programmer','Joey',2000);
insert into group_test values (20,'Architect', 'Martin',2000);
insert into group_test values (20,'Director', 'Michael',2000);
insert into group_test values (30,'Coding', 'Rebecca',3000);
insert into group_test values (30,'Programmer','Rex',3000);
insert into group_test values (30,'Architect', 'Richard',3000);
insert into group_test values (30,'Director', 'Sabrina',3000);
insert into group_test values (40,'Coding', 'Samuel',4000);
insert into group_test values (40,'Programmer','Susy',4000);
insert into group_test values (40,'Architect', 'Tina',4000);
insert into group_test values (40,'Director', 'Wendy',4000);
commit;

3)初始化之后的数据情况如下:

SECOOLER@ora11g> set pages 100
SECOOLER@ora11g> select * from group_test;
 GROUP_ID JOB NAME SALARY
---------- ---------- ---------- ----------
 10 Coding Bruce 1000
 10 Programmer Clair 1000
 10 Architect Gideon 1000
 10 Director Hill 1000
 20 Coding Jason 2000
 20 Programmer Joey 2000
 20 Architect Martin 2000
 20 Director Michael 2000
 30 Coding Rebecca 3000
 30 Programmer Rex 3000
 30 Architect Richard 3000
 30 Director Sabrina 3000
 40 Coding Samuel 4000
 40 Programmer Susy 4000
 40 Architect Tina 4000
 40 Director Wendy 4000
16 rows selected.

4)ROLLUP的数据统计效果

sec@ora10g> select group_id,job,grouping(GROUP_ID),grouping(JOB),sum(salary) from group_test group by rollup(group_id, job);
 GROUP_ID JOB GROUPING(GROUP_ID) GROUPING(JOB) SUM(SALARY)
---------- ---------- ------------------ ------------- -----------
 10 Coding 0 0 1000
 10 Director 0 0 1000
 10 Architect 0 0 1000
 10 Programmer 0 0 1000
 10 0 1 4000
 20 Coding 0 0 2000
 20 Director 0 0 2000
 20 Architect 0 0 2000
 20 Programmer 0 0 2000
 20 0 1 8000
 30 Coding 0 0 3000
 30 Director 0 0 3000
 30 Architect 0 0 3000
 30 Programmer 0 0 3000
 30 0 1 12000
 40 Coding 0 0 4000
 40 Director 0 0 4000
 40 Architect 0 0 4000
 40 Programmer 0 0 4000
 40 0 1 16000
 1 1 40000
21 rows selected.

2. 理解CUBE

sec@ora10g> select group_id,job,grouping(GROUP_ID),grouping(JOB),sum(salary) from group_test group by cube(group_id, job) order by 1;
 GROUP_ID JOB GROUPING(GROUP_ID) GROUPING(JOB) SUM(SALARY)
---------- ---------- ------------------ ------------- -----------
 10 Architect 0 0 1000
 10 Coding 0 0 1000
 10 Director 0 0 1000
 10 Programmer 0 0 1000
 10 0 1 4000
 20 Architect 0 0 2000
 20 Coding 0 0 2000
 20 Director 0 0 2000
 20 Programmer 0 0 2000
 20 0 1 8000
 30 Architect 0 0 3000
 30 Coding 0 0 3000
 30 Director 0 0 3000
 30 Programmer 0 0 3000
 30 0 1 12000
 40 Architect 0 0 4000
 40 Coding 0 0 4000
 40 Director 0 0 4000
 40 Programmer 0 0 4000
 40 0 1 16000
 Architect 1 0 10000
 Coding 1 0 10000
 Director 1 0 10000
 Programmer 1 0 10000
 1 1 40000
25 rows selected.

解释如上结果中GROUPING函数返回值“0”和“1”的含义。

如果显示“1”表示CUBE函数对应的列(例如JOB字段)是由于CUBE函数所产生的空值对应的信息,即对此列进行汇总计算后的结果。

如果显示“0”表示此行对应的这列参未与ROLLUP函数分组汇总活动。

如果还是没有理解清楚,请参见Oracle官方文档中的描述内容:“Using a single column as its argument,GROUPING returns 1 when it encounters a NULL value created by a ROLLUP or CUBE operation. That is, if the NULL indicates the row is a subtotal,GROUPING returns a 1. Any other type of value, including a stored NULL, returns a 0.”

3. 仔细观察一下,CUBE与ROLLUP之间的细微差别

rollup(a,b) 统计列包含:(a,b)、(a)、()

rollup(a,b,c) 统计列包含:(a,b,c)、(a,b)、(a)、()

……以此类推ing……

cube(a,b) 统计列包含:(a,b)、(a)、(b)、()

cube(a,b,c) 统计列包含:(a,b,c)、(a,b)、(a,c)、(b,c)、(a)、(b)、(c)、()

……以此类推ing……

So,上面例子中CUBE的结果比ROLLUP多了下面关于第一列GROUP_ID的统计信息:

 Architect 1 0 10000
 Coding 1 0 10000
 Director 1 0 10000

CUBE在ROLLUP的基础上进一步从各种维度上给出细化的统计汇总结果。

理解grouping()函数

GROUPING函数用来判断是否是合计列

通过grouping()函数排除空值

如何辨别数据中原有的空值和cube扩展所插入的空值?

在oracle8i引入grouping()函数,可以用来识别这些超聚合行。被用来作为grouping()函数参数的表达式必须与出现在group by子句中的表达式相匹配。

用grouping()来扩展报告

另一种使用grouping()的方法是放在having子句中,用来控制在输出中显示哪个层级的聚合。

如下所示:

group by prod_categary,cube(cust_income_level,age_range)
having grouping(cust_income_level)=1;

使用grouping_id()来扩展报告

grouping_id()计算一个表达式,确定其参数中的哪一行(如果有的话)被用来生成超聚合行,然后创建一个为矢量,并将该值作为整型值返回。

SQL> SELECT department_id,job_id,SUM(salary),GROUPING(department_id) d_group,GROUPING(job_id) j_group,grouping_id(department_id,job_id) d_j_group_id
 2 FROM employees 
 3 WHERE department_id IN (10,20,30)
 4 GROUP BY CUBE(department_id,job_id)
 5 ORDER BY grouping_id(department_id,job_id) ASC;
DEPARTMENT_ID JOB_ID SUM(SALARY) D_GROUP J_GROUP D_J_GROUP_ID
------------- ---------- ----------- ---------- ---------- ------------
 30 PU_MAN 11000 0 0 0
 20 MK_REP 6000 0 0 0
 20 MK_MAN 13000 0 0 0
 10 AD_ASST 4400 0 0 0
 30 PU_CLERK 13900 0 0 0
 10 4400 0 1 1
 30 24900 0 1 1
 20 19000 0 1 1
 MK_REP 6000 1 0 2
 MK_MAN 13000 1 0 2
 PU_MAN 11000 1 0 2
 AD_ASST 4400 1 0 2
 PU_CLERK 13900 1 0 2
 48300 1 1 3
14 rows selected.

其中D_J_GROUP_ID列的值是D_GROUP和J_GROUP两列的值的组合,如最后一行,D_GROUP和J_GROUP两列的值的组合即为11,转化为十进制即为3。

理解grouping sets 与rollup()

SQL> SELECT department_id,job_id,SUM(salary),GROUPING(department_id) d_group,GROUPING(job_id) j_group,grouping_id(department_id,job_id) d_j_group_id
 2 FROM employees 
 3 WHERE department_id IN (10,20,30)
 4 GROUP BY GROUPING SETS(department_id,job_id)
 5 ORDER BY grouping_id(department_id,job_id) ASC;
DEPARTMENT_ID JOB_ID SUM(SALARY) D_GROUP J_GROUP D_J_GROUP_ID
------------- ---------- ----------- ---------- ---------- ------------
 20 19000 0 1 1
 30 24900 0 1 1
 10 4400 0 1 1
 MK_REP 6000 1 0 2
 MK_MAN 13000 1 0 2
 PU_MAN 11000 1 0 2
 AD_ASST 4400 1 0 2
 PU_CLERK 13900 1 0 2
8 rows selected.

另外grouping sets()括号里面可以嵌套rollup()或者cube函数,效果其实和单独使用rollup和cube函数一样。而grouping sets的结果其实是单独应用cube函数的结果的子集。

示例如下:

SQL> SELECT department_id,job_id,SUM(salary),GROUPING(department_id) d_group,GROUPING(job_id) j_group,grouping_id(department_id,job_id) d_j_group_id
 2 FROM employees 
 3 WHERE department_id IN (10,20,30)
 4 GROUP BY cube(department_id,job_id)
 5 HAVING grouping_id(department_id,job_id) IN (1,2)
 6 ORDER BY grouping_id(department_id,job_id) ASC;
DEPARTMENT_ID JOB_ID SUM(SALARY) D_GROUP J_GROUP D_J_GROUP_ID
------------- ---------- ----------- ---------- ---------- ------------
 20 19000 0 1 1
 30 24900 0 1 1
 10 4400 0 1 1
 MK_REP 6000 1 0 2
 MK_MAN 13000 1 0 2
 PU_MAN 11000 1 0 2
 AD_ASST 4400 1 0 2
 PU_CLERK 13900 1 0 2
8 rows selected.

理解group by的局限性

group by局限性如下:

  1. LOB列或者嵌套表或数组不能用做group by表达式的一部分。
  2. 标量子查询表达式是不允许的。
  3. 如果group by子句引用任何对象类型的列则查询不能并行化。

相关推荐

一文读懂Prometheus架构监控(prometheus监控哪些指标)

介绍Prometheus是一个系统监控和警报工具包。它是用Go编写的,由Soundcloud构建,并于2016年作为继Kubernetes之后的第二个托管项目加入云原生计算基金会(C...

Spring Boot 3.x 新特性详解:从基础到高级实战

1.SpringBoot3.x简介与核心特性1.1SpringBoot3.x新特性概览SpringBoot3.x是建立在SpringFramework6.0基础上的重大版...

「技术分享」猪八戒基于Quartz分布式调度平台实践

点击原文:【技术分享】猪八戒基于Quartz分布式调度平台实践点击关注“八戒技术团队”,阅读更多技术干货1.背景介绍1.1业务场景调度任务是我们日常开发中非常经典的一个场景,我们时常会需要用到一些不...

14. 常用框架与工具(使用的框架)

本章深入解析Go生态中的核心开发框架与工具链,结合性能调优与工程化实践,提供高效开发方案。14.1Web框架(Gin,Echo)14.1.1Gin高性能实践//中间件链优化router:=...

SpringBoot整合MyBatis-Plus:从入门到精通

一、MyBatis-Plus基础介绍1.1MyBatis-Plus核心概念MyBatis-Plus(简称MP)是一个MyBatis的增强工具,在MyBatis的基础上只做增强不做改变,为简化开发、提...

Seata源码—5.全局事务的创建与返回处理

大纲1.Seata开启分布式事务的流程总结2.Seata生成全局事务ID的雪花算法源码3.生成xid以及对全局事务会话进行持久化的源码4.全局事务会话数据持久化的实现源码5.SeataServer创...

Java开发200+个学习知识路线-史上最全(框架篇)

1.Spring框架深入SpringIOC容器:BeanFactory与ApplicationContextBean生命周期:实例化、属性填充、初始化、销毁依赖注入方式:构造器注入、Setter注...

OpenResty 入门指南:从基础到动态路由实战

一、引言1.1OpenResty简介OpenResty是一款基于Nginx的高性能Web平台,通过集成Lua脚本和丰富的模块,将Nginx从静态反向代理转变为可动态编程的应用平台...

你还在为 Spring Boot3 分布式锁实现发愁?一文教你轻松搞定!

作为互联网大厂后端开发人员,在项目开发过程中,你有没有遇到过这样的问题:多个服务实例同时访问共享资源,导致数据不一致、业务逻辑混乱?没错,这就是分布式环境下常见的并发问题,而分布式锁就是解决这类问题的...

近2万字详解JAVA NIO2文件操作,过瘾

原创:小姐姐味道(微信公众号ID:xjjdog),欢迎分享,转载请保留出处。从classpath中读取过文件的人,都知道需要写一些读取流的方法,很是繁琐。最近使用IDEA在打出.这个符号的时候,一行代...

学习MVC之租房网站(十二)-缓存和静态页面

在上一篇<学习MVC之租房网站(十一)-定时任务和云存储>学习了Quartz的使用、发邮件,并将通过UEditor上传的图片保存到云存储。在项目的最后,再学习优化网站性能的一些技术:缓存和...

Linux系统下运行c++程序(linux怎么运行c++文件)

引言为什么要在Linux下写程序?需要更多关于Linux下c++开发的资料请后台私信【架构】获取分享资料包括:C/C++,Linux,Nginx,ZeroMQ,MySQL,Redis,fastdf...

2022正确的java学习顺序(文末送java福利)

对于刚学习java的人来说,可能最大的问题是不知道学习方向,每天学了什么第二天就忘了,而课堂的讲解也是很片面的。今天我结合我的学习路线为大家讲解下最基础的学习路线,真心希望能帮到迷茫的小伙伴。(有很多...

一个 3 年 Java 程序员 5 家大厂的面试总结(已拿Offer)

前言15年毕业到现在也近三年了,最近面试了阿里集团(菜鸟网络,蚂蚁金服),网易,滴滴,点我达,最终收到点我达,网易offer,蚂蚁金服二面挂掉,菜鸟网络一个月了还在流程中...最终有幸去了网易。但是要...

多商户商城系统开发全流程解析(多商户商城源码免费下载)

在数字化商业浪潮中,多商户商城系统成为众多企业拓展电商业务的关键选择。这类系统允许众多商家在同一平台销售商品,不仅丰富了商品种类,还为消费者带来更多样的购物体验。不过,开发一个多商户商城系统是个复杂的...

取消回复欢迎 发表评论: