一、利用Connect by 构造数列
- select level from dual connect by level <=10
可用于解决百钱买鸡等列方程式问题:
题:老母鸡2块1只,小母鸡2块3只,大白兔3块1只,小白兔7块4只,要求买回来的动物总共100只,并且脚不少于220条不多于340条。输出所有的可能情况,每种动物都至少要购买一只。
解:
- with l as (select rownum n from dual connect by level <50 ),
- x as (select rownum*3 n from dual connect by level <50 ),
- d as (select rownum n from dual connect by level <33 ),
- xb as (select rownum*4 n from dual connect by level <15 )
- select l.n LMJ, x.n XMJ, d.n DBT, xb.n XBT
- from l, x, d, xb
- where l.n * 2 + x.n * 2 / 3 + d.n * 3 + xb.n * 7 / 4 = 100
- and 2 * (l.n + x.n) + 4 * (d.n + xb.n) between 220 and 340
- and l.n + x.n + d.n + xb.n = 100
- and (l.n + x.n) between 30 and 90
- and (d.n + xb.n) between 10 and 70 --多余限制条件为提高效率
二、 START WITH .. CONNECT BY PRIOR..
oracle中的select语句可以用START WITH...CONNECT BY PRIOR子句实现递归查询,connect by 是结构化查询中用到的,其基本语法是:
select ... from <TableName> where <Conditional-1> start with <Conditional-2> connect by <Conditional-3> ;
<Conditional-1>:过滤条件,用于对返回的所有记录进行过滤。
<Conditional-2>:是根结点的限定语句,当然可以放宽限定条件,以取得多个根结点,实际就是多棵树。
<Conditional-3>:是连接条件,其中用PRIOR表示上一条记录,比如 CONNECT BY PRIOR org_id = parent_id就是说上一条记录的org_id 是本条记录的parent_id,即本记录的父亲是上一条记录。
早扫描树结构表时,需要依此访问树结构的每个节点,一个节点只能访问一次,其访问的步骤如下:
第一步:从根节点开始;
第二步:访问该节点;
第三步:判断该节点有无未被访问的子节点,若有,则转向它最左侧的未被访问的子节,并执行第二步,否则执行第四步;
第四步:若该节点为根节点,则访问完毕,否则执行第五步;
第五步:返回到该节点的父节点,并执行第三步骤。
总之:扫描整个树结构的过程也即是中序遍历树的过程。
1. 树结构的描述
树结构的数据存放在表中,数据之间的层次关系即父子关系,通过表中的列与列间的关系来描述,如EMP表中的EMPNO和MGR。EMPNO表示该雇员的编号,MGR表示领导该雇员的人的编号,即子节点的MGR值等于父节点的EMPNO值。在表的每一行中都有一个表示父节点的MGR(除根节点外),通过每个节点的父节点,就可以确定整个树结构。
在SELECT命令中使用CONNECT BY 和蔼START WITH 子句可以查询表中的树型结构关系。其命令格式如下:
SELECT 。。。
CONNECT BY {PRIOR 列名1=列名2|列名1=PRIOR 裂名2}
[START WITH];
其中:CONNECT BY子句说明每行数据将是按层次顺序检索,并规定将表中的数据连入树型结构的关系中。PRIORY运算符必须放置在连接关系的两列中某一个的前面。对于节点间的父子关系,PRIOR运算符在一侧表示父节点,在另一侧表示子节点,从而确定查找树结构是的顺序是自顶向下还是自底向上。在连接关系中,除了可以使用列名外,还允许使用列表达式。START WITH 子句为可选项,用来标识哪个节点作为查找树型结构的根节点。若该子句被省略,则表示所有满足查询条件的行作为根节点。
START WITH: 不但可以指定一个根节点,还可以指定多个根节点。
2.关于PRIOR
运算符PRIOR被放置于等号前后的位置,决定着查询时的检索顺序。
PRIOR被置于CONNECT BY子句中等号的前面时,则强制从根节点到叶节点的顺序检索,即由父节点向子节点方向通过树结构,我们称之为自顶向下的方式。如:
CONNECT BY PRIOR EMPNO=MGR
PIROR运算符被置于CONNECT BY 子句中等号的后面时,则强制从叶节点到根节点的顺序检索,即由子节点向父节点方向通过树结构,我们称之为自底向上的方式。例如:
CONNECT BY EMPNO=PRIOR MGR
在这种方式中也应指定一个开始的节点。
3. 定义查找起始节点
在自顶向下查询树结构时,不但可以从根节点开始,还可以定义任何节点为起始节点,以此开始向下查找。这样查找的结果就是以该节点为开始的结构树的一枝。
4.使用LEVEL
在具有树结构的表中,每一行数据都是树结构中的一个节点,由于节点所处的层次位置不同,所以每行记录都可以有一个层号。层号根据节点与根节点的距离确定。不论从哪个节点开始,该起始根节点的层号始终为1,根节点的子节点为2。
5.节点和分支的裁剪
在对树结构进行查询时,可以去掉表中的某些行,也可以剪掉树中的一个分支,使用WHERE子句来限定树型结构中的单个节点,以去掉树中的单个节点,但它却不影响其后代节点(自顶向下检索时)或前辈节点(自底向顶检索时)。
6.排序显示
象在其它查询中一样,在树结构查询中也可以使用ORDER BY 子句,改变查询结果的显示顺序,而不必按照遍历树结构的顺序。
例:
- create table t2(
- root_id number,
- id number,
- name varchar(5),
- description varchar(10)
- );
- insert into t2(root_id,id,name,description) values(0,1,'a','aaa');
- insert into t2(root_id,id,name,description) values(1,2,'a1','aaa1');
- insert into t2(root_id,id,name,description) values(1,3,'a2','aaa2');
- insert into t2(root_id,id,name,description) values(0,4,'b','bbb');
- insert into t2(root_id,id,name,description) values(4,5,'b1','bbb1');
- insert into t2(root_id,id,name,description) values(4,6,'b2','bbb2');
- select * from t2;
- select * from t2 start with root_id =0 connect by prior id= root_id;
三 深入了解
1. 深入理解connect by (帖子地址)
对单记录/单条数据使用connect by 正常,多条使用需要注意,其本质为每一条记录都作为自己或者其他记录的叶子进行连接
- select id,level from t connect by level<4;
其自连接的39条结果分布为
用sql直观展示为(38#)
- select rownum,
- level,
- sys_connect_by_path(id, ',') path,
- id,
- connect_by_isleaf isleaf
- from t
- connect by nocycle level < 4
- order by rownum, level, path;
2. GROUP BY 已知name 和name出现次数反求数据
a
- WITH data AS (
- SELECT 'A' name, 2 cnt FROM DUAL
- UNION ALL SELECT 'B', 4 FROM DUAL
- UNION ALL SELECT 'C', 1 FROM DUAL
- )
- SELECT name
- FROM data
- CONNECT BY name=PRIOR name AND LEVEL<=cnt ANDPRIOR SYS_GUID() IS NOT NULL;
其中连接条件PRIOR SYS_GUID() IS NOT NULL 的解释为:
CONNECT BY 相当于是一个递归的自连接,不断地把每层的连接结果叠加到结果集中。两层之间的连接条件和递归出口写在CONNECT BY中。
在这的数据并无父子关系,只是要让同一行数据重复出现,因此连接的条件只用到了表的主键id=PRIOR id, 此外再用LEVEL控制层数作为递归出口
。但ORACLE有个检查,如果你有前后连接条件(id=PRIOR id),但是同一行数据再次出现,
它就会报一个错:ERROR:ORA-01436: CONNECT BY loop in user data
为了欺骗它,这里用了一个PRIOR DBMS_RANDOM.VALUE, 因为DBMS_RANDOM.VALUE每次调用都返回不同结果,所以它认为两行数据不一样,所以不报错了。
递归写法
- WITH data AS (
- SELECT 'A' name, 2 cnt FROM DUAL
- UNION ALL SELECT 'B', 4 FROM DUAL
- UNION ALL SELECT 'C', 1 FROM DUAL
- ),
- rdata (name, cnt, lv) as
- (
- select name, cnt, 1 as lv from data
- union all
- select name, cnt, lv + 1 as lv from rdata where lv + 1 <= cnt
- )
- select * from rdata
- order by name, lv;