union and union all

本文通过具体实例详细介绍了SQL中UNION、UNION ALL等集合操作符的使用方法及区别,包括对重复数据的处理、自动排序规则以及ORDER BY子句的应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

假设我们有一个表Student,包括以下字段与数据:
 
[c-sharp] view plaincopy
drop table student;  
  
create table student  
(  
id int primary key,  
name nvarchar2(50) not null,  
score number not null  
);  
  
insert into student values(1,'Aaron',78);  
insert into student values(2,'Bill',76);  
insert into student values(3,'Cindy',89);  
insert into student values(4,'Damon',90);  
insert into student values(5,'Ella',73);  
insert into student values(6,'Frado',61);  
insert into student values(7,'Gill',99);  
insert into student values(8,'Hellen',56);  
insert into student values(9,'Ivan',93);  
insert into student values(10,'Jay',90);  
  
commit;  


 
首先,我们来看一下UNION的例子:


[c-sharp] view plaincopy
SQL> select *  
  2  from student  
  3  where id<4  
  4  union  
  5  select *  
  6  from student  
  7  where id>2 and id<6  
  8  ;  
  
        ID NAME                                SCORE  
---------- ------------------------------ ----------  
         1 Aaron                                  78  
         2 Bill                                   76  
         3 Cindy                                  89  
         4 Damon                                  90  
         5 Ella                                   73  
  
SQL>  


 
如果换成Union All连接两个结果集,则结果如下:
 
[c-sharp] view plaincopy
SQL> select *  
  2  from student  
  3  where id<4  
  4  union all  
  5  select *  
  6  from student  
  7  where id>2 and id<6  
  8  ;  
  
        ID NAME                                SCORE  
---------- ------------------------------ ----------  
         1 Aaron                                  78  
         2 Bill                                   76  
         3 Cindy                                  89  
         3 Cindy                                  89  
         4 Damon                                  90  
         5 Ella                                   73  
  
6 rows selected.  


 
可以看到,Union和Union All的区别之一在于对重复结果的处理。
 
接下来,我们交换一个两个SELECT语句的顺序,看看结果是怎样的。
 
[c-sharp] view plaincopy
SQL> select *  
  2  from student  
  3  where id>2 and id<6  
  4  union  
  5  select *  
  6  from student  
  7  where id<4  
  8  ;  
  
        ID NAME                                SCORE  
---------- ------------------------------ ----------  
         1 Aaron                                  78  
         2 Bill                                   76  
         3 Cindy                                  89  
         4 Damon                                  90  
         5 Ella                                   73  
  
SQL> select *  
  2  from student  
  3  where id>2 and id<6  
  4  union all  
  5  select *  
  6  from student  
  7  where id<4  
  8  ;  
  
        ID NAME                                SCORE  
---------- ------------------------------ ----------  
         3 Cindy                                  89  
         4 Damon                                  90  
         5 Ella                                   73  
         1 Aaron                                  78  
         2 Bill                                   76  
         3 Cindy                                  89  
  
6 rows selected.  


 
可以看到,对于UNION来说,交换两个SELECT语句的顺序后结果仍然是一样的,这是因为UNION会自动排序。而UNION ALL在交换了SELECT语句的顺序后结果则不相同,因为UNION ALL不会对结果自动进行排序。
 
那么这个自动排序的规则是什么呢?我们交换一下SELECT后面选择字段的顺序(前面使用SELECT *相当于SELECT ID,NAME,SCORE),看看结果如何:
 
[c-sharp] view plaincopy
SQL> select score,id,name  
  2  from student  
  3  where id<4  
  4  union  
  5  select score,id,name  
  6  from student  
  7  where id>2 and id<6  
  8  ;  
  
     SCORE         ID NAME  
---------- ---------- ------------------------------  
        73          5 Ella  
        76          2 Bill  
        78          1 Aaron  
        89          3 Cindy  
        90          4 Damon  


 
可是看到,此时是按照字段SCORE来对结果进行排序的(前面SELECT *的时候是按照ID进行排序的)。
 
那么有人会问,如果我想自行控制排序,能不能使用ORDER BY呢?当然可以。不过在写法上有需要注意的地方:
 
[c-sharp] view plaincopy
select score,id,name  
from student  
where id > 2 and id < 7  
  
union  
  
select score,id,name  
from student  
where id < 4  
  
union  
  
select score,id,name  
from student  
where id > 8  
order by id desc  


 
order by子句必须写在最后一个结果集里,并且其排序规则将改变操作后的排序结果。对于Union、Union All、Intersect、Minus都有效。
 
其他的集合操作符,如Intersect和Minus的操作和Union基本一致,这里一起总结一下:
 
Union,对两个结果集进行并集操作,不包括重复行,同时进行默认规则的排序;
Union All,对两个结果集进行并集操作,包括重复行,不进行排序;
Intersect,对两个结果集进行交集操作,不包括重复行,同时进行默认规则的排序;
Minus,对两个结果集进行差操作,不包括重复行,同时进行默认规则的排序。
 
可以在最后一个结果集中指定Order by子句改变排序方式。
### Union All 报错的原因及解决方案 在数据库操作中,`UNION ALL` 是一种常见的用于合并多个查询结果的操作符。然而,在某些情况下可能会遇到错误。以下是针对不同数据库环境下的 `UNION ALL` 报错原因及其解决方案。 #### MySQL 中的 `UNION ALL` 行数过多问题 当使用 `UNION ALL` 拼接大量数据时,可能出现性能下降甚至报错的情况。这是因为 SQL 解析器无法有效处理过量的数据行。通过将原始查询封装在一个子查询中,可以显著改善这一问题[^1]。例如: ```sql SELECT Q.名称 FROM ( SELECT 'aaaaaaaa' AS 名称 UNION ALL SELECT 'bbbbbbbb' UNION ALL SELECT 'ccccccccc' UNION ALL SELECT 'dddddddd' /* 后续更多行 */ ) Q; ``` 上述方式能够正常显示结果,其具体原理在于子查询结构减少了单次解析的压力,从而提升了执行效率。 #### Oracle 数据库中的 CLOB 字段与 `UNION` 去重冲突 在 Oracle 数据库环境下,如果涉及 `CLOB` 类型字段,则直接应用 `UNION` 进行去重可能导致异常。这是由于 `CLOB` 数据类型的特殊性质所致[^2]。对此类情况的有效应对策略如下: - 避免对含有 `CLOB` 列的结果集实施自动去重; - 若确实需要去除重复项,可考虑先转换成其他适合比较的形式再做进一步处理; #### Hive 查询失败案例分析 (DAG 提交失败) 对于大数据平台 Apache Hive 而言,“Dag submit failed due to 1-1 Edge...” 错误提示表明当前作业计划存在问题,特别是关于顶点间连接配置方面的要求未满足条件——即目标节点并行度需匹配源端设置[^3]。面对这种情况可以从以下几个角度入手调整优化方案: - **精简输入来源数量**: 尽量降低参与运算表格数目或是缩小各分支返回规模. - **统一输出定义标准**: 确认所有组成部分具备相同列名列表以及相应属性描述. 最终目的是让整个流程更加高效稳定运行而不会触发类似的限制约束违反情形发生. --- ### 示例代码片段展示如何修正Hive Query 下面给出一段经过改进后的 HiveQL 示范程序来规避前面提到过的 dag submission failure issue : ```sql -- Optimize the union all query by ensuring consistent output types and reducing complexity WITH filtered_data_1 AS ( SELECT id, name FROM table_a WHERE condition_x = true LIMIT 1000 -- Limit rows for efficiency ), filtered_data_2 AS ( SELECT id, name FROM table_b WHERE condition_y = false LIMIT 1000 -- Similarly limit here too ) SELECT * FROM filtered_data_1 UNION ALL SELECT * FROM filtered_data_2; ``` 此版本不仅限定了每条路径上的最大记录上限还保证了两者的字段构成一致性以便顺利组合在一起形成最终结果集合. ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值