用公共表达式 实现递归查询

本文介绍了SQL中的递归公用表表达式(CTE),详细解释了递归CTE的组成部分,包括定位点成员、递归成员及终止检查,并通过一个树形数据结构的例子展示了递归CTE的具体应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

公用表表达式 (CTE) 具有一个重要的优点,那就是能够引用其自身,从而创建递归 CTE。递归 CTE 是一个重复执行初始 CTE 以返回数据子集直到获取完整结果集的公用表表达式。

递归查询通常用于返回分层数据(即遍历树结构)

clear.gif 递归 CTE 的结构(MSDN)

递归 CTE 由下列三个元素组成:
  1. 例程的调用。
    递归 CTE 的第一个调用包括一个或多个由 UNION ALL、UNION、EXCEPT 或 INTERSECT 运算符联接的 CTE_query_definitions。由于这些查询定义形成了 CTE 结构的基准结果集,所以它们被称为“定位点成员”。
    CTE_query_definitions 被视为定位点成员,除非它们引用了 CTE 本身。所有定位点成员查询定义必须放置在第一个递归成员定义之前,而且必须使用 UNION ALL 运算符联接最后一个定位点成员和第一个递归成员。
  2. 例程的递归调用。
    递归调用包括一个或多个由引用 CTE 本身的 UNION ALL 运算符联接的 CTE_query_definitions。这些查询定义被称为“递归成员”。
  3. 终止检查。
    终止检查是隐式的;当上一个调用中未返回行时,递归将停止。
伪代码和语义

递归 CTE 结构必须至少包含一个定位点成员和一个递归成员。以下伪代码显示了包含一个定位点成员和一个递归成员的简单递归 CTE 的组件。

WITH cte_name ( column_name [,...n] )

AS

(

CTE_query_definition –- Anchor member is defined.

UNION ALL

CTE_query_definition –- Recursive member is defined referencing cte_name.

)

-- Statement using the CTE

SELECT *  FROM cte_name

递归执行的语义如下:
  1. 将 CTE 表达式拆分为定位点成员和递归成员。
  2. 运行定位点成员,创建第一个调用或基准结果集 (T0)。
  3. 运行递归成员,将 Ti 作为输入,将 Ti+1 作为输出。
  4. 重复步骤 3,直到返回空集。
  5. 返回结果集。这是对 T0 到 Tn 执行 UNION ALL 的结果。

注意点:

(1)递归 CTE 定义至少必须包含两个 CTE 查询定义(一个定位点成员和一个递归成员)。也可以定义多个定位点成员和递归成员;但必须将所有定位点成员查询定义置于第一个递归成员定义之前。

(2)定位点成员必须(UNION ALL、UNION、INTERSECT 或 EXCEPT)之一结合使用。在最后一个定位点成员和第一个递归成员之间,以及组合多个递归成员时,只能使用 UNION ALL 运算符。

(3)定位点成员和递归成员中的列数必须一致。

(4)递归成员中列的数据类型必须与定位点成员中相应列的数据类型兼容。

(5)递归成员的 FROM 子句只能引用一次 CTE expression_name。

(6)在递归成员的 CTE_query_definition 中不允许出现下列项:

( DISTINCT、GROUP BY、HAVING、标量聚合、TOP、LEFT、RIGHT、OUTER JOIN(允许出现 INNER JOIN)、子查询)

(7)无论参与的 SELECT 语句返回的列的为空性如何,递归 CTE 返回的全部列都可以为空。

(8)如果递归 CTE 组合不正确,可能会导致无限循环。

(9)不能使用包含递归公用表表达式的视图来更新数据。

(10)可以使用 CTE 在查询上定义游标。递归 CTE 只允许使用快速只进游标和静态(快照)游标。如果在递归 CTE 中指定了其他游标类型,则该类型将转换为静态游标类型。

(11)可以在 CTE 中引用远程服务器中的表。如果在 CTE 的递归成员中引用了远程服务器,那么将为每个远程表创建一个假脱机,这样就可以在本地反复访问这些表。

举例

创建表
CREATE TABLE TREES
(ID int ,ROOTS char(6),SUB char(6) )
--插入数据(即一个树结构)
INSERT INTO TREES SELECT 1,'A','B'
INSERT INTO TREES SELECT 2,'A','C'
INSERT INTO TREES SELECT 3,'B','D'
INSERT INTO TREES SELECT 4,'B','E'
INSERT INTO TREES SELECT 5,'C','F'
INSERT INTO TREES SELECT 6,'M','U'
INSERT INTO TREES SELECT 7,'M','N'
INSERT INTO TREES SELECT 8,'N','L'

数据如下:

ID  ROOTS  SUB

1    A         B    
2    A         C    
3    B         D    
4    B         E    
5    C         F    
6    M         U    
7    M         N    
8    N         L    

--遍历以A开头的整个树
WITH read_tree(ID,ROOTS,SUB)
AS
(--起始条件(基准结果集)
SELECT ID,ROOTS,SUB
FROM TREES
WHERE ROOTS='A'
UNION ALL
--递归条件
SELECT M.ID,M.ROOTS,M.SUB
FROM TREES AS M
INNER JOIN read_tree
ON  M.ROOTS = read_tree.SUB
)
SELECT * FROM read_tree

结果如下:

ID  ROOTS  SUB

1    A         B    
2    A         C    
5    C         F    
3    B         D    
4    B         E    

转载于:https://www.cnblogs.com/dyufei/archive/2009/11/16/2573969.html

### 回答1: 当您在Hive中实现递归查询时,可以使用Common Table Expressions(CTE)或子查询来编写SQL查询。 以下是使用CTE来实现递归查询的示例: WITH RECURSIVE employee_hierarchy AS ( SELECT employee_id, employee_name, manager_id FROM employee WHERE employee_id = 1 -- Starting employee UNION ALL SELECT e.employee_id, e.employee_name, e.manager_id FROM employee e JOIN employee_hierarchy eh ON e.manager_id = eh.employee_id ) SELECT * FROM employee_hierarchy; 在上面的示例中,我们使用了一个CTE名为employee_hierarchy,它具有递归定义。该定义的基本部分是从employee表中选择起始员工(在此示例中为employee_id = 1),并将其放入结果集中。然后,我们使用JOIN将结果集中的员工与其经理相匹配,并将其加入到结果集中,直到不再有经理为止。 您还可以使用子查询实现递归查询,如下所示: SELECT employee_id, employee_name, manager_id FROM ( SELECT employee_id, employee_name, manager_id FROM employee WHERE employee_id = 1 -- Starting employee UNION ALL SELECT e.employee_id, e.employee_name, e.manager_id FROM employee e JOIN ( SELECT employee_id, employee_name, manager_id FROM employee ) eh ON e.manager_id = eh.employee_id ) employee_hierarchy; 在这个例子中,我们使用了一个子查询来模拟递归。子查询部分包含相同的逻辑,即从employee表中选择起始员工并将其放入结果集中,然后通过JOIN将其经理加入到结果集中,直到不再有经理为止。最后,我们在外部查询中选择子查询的结果集。 以上是使用Hive实现递归查询的两种方法。无论使用哪种方法,都需要确保查询语句具有正确的递归定义,以便避免无限递归和死循环。 ### 回答2: Hive是一种在Hadoop生态系统中运行的数据仓库解决方案,它使用类似于SQL的查询语言(HiveQL)来处理和分析大规模结构化数据。 Hive在查询语言中支持CTE(公共表达式),这使得在Hive中实现递归查询变得可能。递归查询是一种在查询结果中使用一种递增的方式来引用同一张表或视图的查询。 要在Hive中实现递归查询,我们可以使用WITH RECURSIVE关键字来定义递归查询。这样的查询通常包括两部分:基本查询递归部分。 基本查询是初始查询的部分,它是定义递归查询的起点。递归部分是在基本查询的结果上逐步递增的查询部分。 以下是一个使用Hive实现递归查询的示例: WITH RECURSIVE recursive_query AS ( -- 基本查询 SELECT column1, column2 FROM table_name WHERE condition UNION ALL -- 递归部分 SELECT column1, column2 FROM table_name WHERE condition JOIN recursive_query ON table_name.column = recursive_query.column ) -- 最终查询 SELECT * FROM recursive_query; 在这个例子中,我们定义了一个名为recursive_query的递归查询。基本查询部分从表table_name中选择column1和column2,并且满足特定条件。递归部分再次选择相同的列,然后使用JOIN子句将它与递归查询的结果连接起来。 最终查询部分是对递归查询结果执行的最终SELECT语句。 总结起来,使用Hive可以通过使用CTE和WITH RECURSIVE关键字来实现递归查询。这使得在大规模结构化数据中进行复杂查询变得更加容易。 ### 回答3: Hive是一个基于Hadoop的数据仓库工具,它可以用于存储和处理大规模数据集。虽然Hive不直接支持递归查询,但我们可以通过编写自定义函数来实现递归查询的功能。 首先,我们需要创建一个自定义函数。自定义函数是指在Hive中定义的可以用于执行特定任务的函数。我们可以使用Java或Python来编写自定义函数。 接下来,我们需要定义一个递归函数,该函数将在查询中使用。递归函数应该接受一个参数作为输入,并返回一个结果。在函数内部,我们可以使用递归的方式来处理数据。 在查询中,我们可以使用WITH RECURSIVE关键字来指定递归查询递归查询是一种在SQL中定义递归关系的方法。我们可以在递归查询中使用自定义函数来处理数据。 下面是一个示例,演示如何在Hive中实现递归查询SQL。 首先,创建一个自定义函数: ``` CREATE FUNCTION my_recursive_function(input STRING) RETURNS STRING ``` 然后,编写递归函数的代码: ``` public class MyRecursiveFunction extends UDF { public String evaluate(String input) { // 递归处理数据的代码 } } ``` 接下来,注册自定义函数: ``` ADD JAR /path/to/jar/my_recursive_function.jar; CREATE TEMPORARY FUNCTION my_recursive_function AS 'com.example.MyRecursiveFunction'; ``` 最后,使用递归查询进行数据查询: ``` WITH RECURSIVE recursive_query AS ( SELECT my_recursive_function('input') AS result UNION ALL SELECT my_recursive_function(result) AS result FROM recursive_query WHERE result <> 'end' ) SELECT * FROM recursive_query; ``` 在这个示例中,我们首先定义了一个自定义函数`my_recursive_function`,然后在递归查询中使用该函数来处理数据。通过递归查询,我们可以持续地处理数据,直到满足退出条件。 总结起来,虽然Hive本身不直接支持递归查询,但通过编写自定义函数并在递归查询中使用它们,我们可以在Hive中实现递归查询的功能。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值