在Oracle中,有一个很有趣的东西,那就是rownum。当你从某个表中查询数据的时候,返回的结果集中都会带有rownum这个字段,而且有时候也可以使用rownum进行一些条件查询。
在查询中,我们可以注意到,类似于“select xx from table where rownum < n”(n>1)这样的查询是有正确含义的,而“select xx from table where rownum = n”这样的查询只在n=1的时候成立,“select xx from table where rownum > n”(n>1)这样的查询只能得到一个空集。另外“select xx from table where rownum > 0”这个查询会返回所有的记录。这是为什么呢?原因就在于Oracle对rownum的处理上,rownum是在得到结果集的时候产生的,用于标记结果集中结果顺序的一个字段,这个字段被称为“伪数列”,也就是事实上不存在的一个数列。它的特点是按顺序标记,而且是逐次递加的,换句话说就是只有有rownum=1的记录,才可能有rownum=2的记录。
让我们回头来分析一下在where中使用rownum作为查询条件的情况。在rownum取=1,或者rownum <= n (n>1)的时候,没有问题。那么为什么当条件为rownum = n或者rownum >= n时明明有数据却只能得到一个空集呢?假设我们的查询条件为rownum = 2,那么在查询出的第一条记录的时候,oracle标记此条记录rownum为1,结果发现和rownum=2的条件不符,于是结果集为空。写到这里,我忽然有一个有趣的想法:假如有一条查询语句为select xx,yy from table where zz > 20 and rownum < 10,那么在执行的时候,是先按照zz>20的条件查询出一个结果集,然后按照rownum取出前10条返回?还是在按照zz>20的条件先查询,然后有一个记录就标记一个rownum,到rownum<10的时候就停止查询?我觉得应该是后者,也就是在执行语句的时候,不是做full scan,而是取够数据就停止查询。要验证这个想法应该很简单,找一个数据量非常大的表进行查询就可以了。可惜目前我没有这样的表。
我们可以看出,直接使用rownum是要受到限制的。但是很容易遇到这样的需求“查出符合条件的第xx条到第xx条记录”,比如页面的分页处理。这个时候如何构造出适合自己的结果集?嗯,墙边那位说全取出来手工挑选的哥们可以拉出去了。当然这样做也是可以的,但是前提是整个数据集的数据条数不多的情况下。假如遇到上十万百条的数据,全部取出来的话,用户就不用干别的事情了。这个时候用户应该怎么做呢?当然就是要用到我们介绍的rownum拉!rownum不是个“伪数列”么,好说,我们现在把它弄成一个实在的字段就可以了。具体做法就是利用子查询,在构建临时表的时候,把rownum也一起构造进去。比如“select xx,yy from (select xx,yy,rownum as xyz from table where zz >20) where xyz between 10 and 20”这样就可以了。另外使用oracle提供的结果集处理函数minus也可以做到,例如“select xx,yy from table where zz > 20 and rownum <20 minus select xx,yy from table where zz>20 and rownum <10”,但是使用minus好像比使用子查询更加消耗资源。
和rownum相似,oracle还提供了另外一个伪数列:rowid。不过rowid和rownum不同,一般说来每一行数据对应的rowid是固定而且唯一的,在这一行数据存入数据库的时候就确定了。可以利用rowid来查询记录,而且通过rowid查询记录是查询速度最快的查询方法。(这个我没有试过,另外要记住一个长度在18位,而且没有太明显规律的字符串是一个很困难的事情,所以我个人认为利用rowid查询记录的实用性不是很大)rowid只有在表发生移动(比如表空间变化,数据导入/导出以后),才会发生变化。
问题:Oracle将ROWID和ROWNUM区别开了吗?如果他们有区别,那么他们的区别是什么呢?
回答:正如你的地址唯一的标识了你的住处,一个oracle的rowid唯一的标识了一条数据的物理地址。
rowid提供了你找到这一行数据所需要的所有信息,硬盘号,柱面,块和所在块上的偏移地址。
rownum是一个伪码,一个你可以在SQL*Plus中引用的占位符。rownum可以用于书写专业的sql语句和调整sql。
在sql语句中使用rownum要注意:
正确:where rownum<n;
where rownum=1;
错误:where rownum>n;
where rownum=some_num>1
如果你非得这么写的话,这样才正确:
select * from(
select rownum rn,t.* from t
)
where rn=3;
例如,为了显示前5条数据,你可以用rownum作为过滤器:
SQL> select rownum,emp.empno,emp.ename,emp.job from emp
2 where rownum<=5;
ROWNUM EMPNO ENAME JOB
---------- ----- ---------- ---------
1 7369 SMITH CLERK
2 7499 ALLEN SALESMAN
3 7521 WARD SALESMAN
4 7566 JONES MANAGER
5 7654 MARTIN SALESMAN
总之,rowid和rownum的区别是rownum是暂时的而rowid是永久的。
另外,rowid可以用来获取一个数据行,rowid仅仅在单个sql语句内容里面有意义,一种参照取出的数据集的方式。
SQL> select rownum,rowid,empno,initcap(ename),initcap(job),sal from emp;
ROWNUM ROWID EMPNO INITCAP(ENAME) INITCAP(JOB) SAL
---------- ------------------ ----- -------------- ------------ ---------
1 AAAL+ZAAEAAAAAdAAA 7369 Smith Clerk 800.00
2 AAAL+ZAAEAAAAAdAAB 7499 Allen Salesman 1600.00
3 AAAL+ZAAEAAAAAdAAC 7521 Ward Salesman 1250.00
4 AAAL+ZAAEAAAAAdAAD 7566 Jones Manager 2975.00
5 AAAL+ZAAEAAAAAdAAE 7654 Martin Salesman 1250.00
6 AAAL+ZAAEAAAAAdAAF 7698 Blake Manager 2850.00
7 AAAL+ZAAEAAAAAdAAG 7782 Clark Manager 2450.00
8 AAAL+ZAAEAAAAAdAAH 7788 Scott Analyst 3000.00
9 AAAL+ZAAEAAAAAdAAI 7839 King President 5000.00
10 AAAL+ZAAEAAAAAdAAJ 7844 Turner Salesman 1500.00
11 AAAL+ZAAEAAAAAdAAK 7876 Adams Clerk 1100.00
12 AAAL+ZAAEAAAAAdAAL 7900 James Clerk 950.00
13 AAAL+ZAAEAAAAAdAAM 7902 Ford Analyst 3000.00
14 AAAL+ZAAEAAAAAdAAN 7934 Miller Clerk 1300.00