Order By 的使用

本文详细解析了 SQL 中 UNION 的使用方法,包括如何避免因列名不一致导致的错误,以及 ORDER BY 在 UNION 结构中的正确应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

        一个sql中,union了几个子查询。单独执行每个子查询都没问题,但union后执行,报
ORA-00904: "xxx": invalid identifier

所union的各个子查询要有相同数量的列,且对应位置的列必须具有相同的数据类型;但列的名字可以不同。
the diffrence between UNION ALL and UNION is that UNION will attempt to eliminate duplicates.



Sql代码
  1. SELECT supplier_city   
  2. FROM suppliers   
  3. WHERE supplier_name 'IBM'  
  4. ORDER BY DESC 
SELECT supplier_city FROM suppliers WHERE supplier_name = 'IBM' ORDER BY 1 DESC;

This would return all records sorted by the supplier_city field in descending order, since the supplier_city field is in position #1 in the result set.



union中order by的使用:
You have to use the Order By at the end of ALL the unions。
the ORDER BY is considered to apply to the whole UNION result(it's effectively got lower binding priority than the UNION). 
The ORDER BY clause just needs to be the last statement, after you've done all your unioning. You can union several sets together, then put an ORDER BY clause after the last set.
所以,能在union的最后一个子查询中使用order by,而这个order by是针对整个unioning后的结果集的。So:
如果unoin的几个子查询列名不同,如
 
Sql代码
  1. select supplier_id, supplier_name   
  2. from suppliers   
  3. UNION  
  4. select company_id, company_name   
  5. from companies   
  6. ORDER BY ?;  
select supplier_id, supplier_name from suppliers UNION select company_id, company_name from companies ORDER BY ?;

这里的问号如果是company_name,则执行整个查询会报“company_name:invalid identifier”(当然,单独执行第二个含order by的子查询是没有问题的);这是因为unioning后结果集的列名是以第一个参加union的子查询的列名为准的;order by针对的是整个unioning后的结果集。对整个查询结果来说,无”company_name“这个字段
如果是supplier_name,则单独执行第二个含order by的子查询是会报“supplier_name:invalid identifier”的,而执行整个查询是没有问题的,因为order by针对的是unioning后的整个结果集,而这“整个结果集”是有supplier_name这列的(以第一个union子查询的列名作为unioning后整个结果集的列名)

为了避免这样事情的发生,可以:
1 使用列序号代替实际列名。如:
 
Sql代码
  1. select supplier_id, supplier_name   
  2. from suppliers   
  3. UNION  
  4. select company_id, company_name   
  5. from companies   
  6. ORDER BY 2;  
select supplier_id, supplier_name from suppliers UNION select company_id, company_name from companies ORDER BY 2;

2 为unoin的各个子查询使用相同的列名,如:
 
Sql代码
  1. select supplier_id as id, supplier_name as name  
  2. from suppliers   
  3. UNION  
  4. select company_id as id, company_name as name  
  5. from companies   
  6. ORDER BY name 
select supplier_id as id, supplier_name as name from suppliers UNION select company_id as id, company_name as name from companies ORDER BY name;


这样,不管是执行整个查询还是单独执行包含order by的最后一个union子查询,都不会有问题。



 
I have two tables, TableA and TableB defined as follows,

TableA
A1 int
A2 int
A3 int

TableB
B1 int
B2 int
B3 int

If I try to run this query, SQL Server says syntex failed at the Order By clouse. Is such Order by not allowed in SQL, Any other way to achieve this?
Sql代码
  1. (Select A1, A2 from TableA)   
  2. Union All  
  3. (Select B1, B2 from TableB Order by B3)  
(Select A1, A2 from TableA) Union All (Select B1, B2 from TableB Order by B3)

Any help will be appreciated.

A:
引用
First of all, you can not order by a column that is not included in your SELECT list(我注:这句话是错误的;可以order by一个不在select列表中的column). Secondly, when performing a UNION query the ORDER BY clause must be(我注:not “must be”!) a column index not a column name, because a UNION query does not have column headings (although SQL Server(我注:此处泛指DBMS) pretends that it has by picking the column names used in the first query although this is not ANSI compliant]). Assuming you want to order the second column (A2 and B2) your query should look like this:
Code:
Sql代码
  1.    SELECT A1, A2   
  2.      FROM TableA   
  3. UNION ALL  
  4.    SELECT B1, B2   
  5.      FROM TableB   
  6.  ORDER BY  
 SELECT A1, A2 FROM TableA UNION ALL SELECT B1, B2 FROM TableB ORDER BY 2


Conceptually, ORDER BY works by producing the final query table with all the queries joined together (if it is a UNION query), then it orders the query results and does not care about what is in the database.
### 回答1: Spark SQL的orderBy操作用于按照指定的列对数据进行排序。orderBy默认是升序排序,如果需要降序排序,则需要使用desc()函数。 示例代码: ```python from pyspark.sql.functions import desc # 读取数据 df = spark.read.format("csv").load("path/to/file.csv", header=True) # 按照列名进行升序排序 df.orderBy("column_name").show() # 按照列名进行降序排序 df.orderBy(desc("column_name")).show() # 按照多个列进行排序,先按照列1排序,再按照列2排序 df.orderBy("column1", "column2").show() ``` 注意:orderBy操作是一个宽依赖操作,会导致数据的全局重排,因此在处理大规模数据时需要注意性能问题。 ### 回答2: SparkSQL中的orderBy函数用于对结果进行排序。orderBy函数收一个或多个列作为参数,并且可以指定排序的方式,如升序或降序。 使用orderBy函数的一般格式如下: ``` df.orderBy(col("column1").asc(), col("column2").desc()) ``` 在上面的示例中,orderBy函数按照column1列进行升序排序,并按照column2列进行降序排序。 orderBy函数可以直对列进行排序,也可以对列的别名进行排序。例如,可以对一个计算列进行排序,如下所示: ``` df.withColumn("calculated", col("column1") + col("column2")).orderBy(col("calculated").asc()) ``` 在这个示例中,首先创建了一个名为calculated的计算列,该列为column1和column2列之和,并且将结果按照calculated列进行升序排序。 orderBy函数还可以收多个列的排序条件,并且支持链式调用。例如: ``` df.orderBy(col("column1").asc()).orderBy(col("column2").desc()) ``` 在这个示例中,首先按照column1列进行升序排序,然后再按照column2列进行降序排序。 需要注意的是,orderBy函数返回一个新的DataFrame,原始的DataFrame不会发生改变。因此,如果需要对排序结果进行后续操作,需要将排序后的结果保存到一个变量中。 在使用orderBy函数时,还可以进行一些其他的操作,如对列进行表达式计算、使用函数等,以满足不同的需求。 总结来说,orderBy函数用于对SparkSQL中的DataFrame进行排序,可以按照一个或多个列进行排序,支持升序或降序排序,并且可以进行一些其他操作,如计算列、使用函数等。 ### 回答3: Spark SQL中的orderBy是用于对结果进行排序的函数。orderBy可以根据给定的列对结果进行升序或降序排序。 orderBy函数的使用方法如下: 1. 单个列排序: orderBy("column"):按照指定的列对结果进行升序排序,默认为升序。 orderBy($"column".desc):按照指定的列对结果进行降序排序。 2. 多个列排序: orderBy("column1", "column2"):首先按照column1排序,如果有相同的值,则再按照column2排序。 orderBy($"column1".desc, $"column2"):首先按照column1进行降序排序,如果有相同的值,则按照column2排序。 例如,假设有一个包含姓名和年龄的表,我们可以使用orderBy函数对结果按照姓名进行升序排序,或者按照年龄进行降序排序。 示例代码如下: 1. 单个列排序: df.orderBy("name"):按照姓名升序排序。 df.orderBy($"name".desc):按照姓名降序排序。 2. 多个列排序: df.orderBy("name", "age"):首先按照姓名排序,如果有相同的姓名,则按照年龄排序。 df.orderBy($"name".desc, $"age"):首先按照姓名降序排序,如果有相同姓名,则按照年龄排序。 总结: orderBy函数用于对Spark SQL查询结果进行排序,可以按照单个列或多个列进行排序,并且可以指定升序或降序排序。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值