建立一个Web应用,分页浏览功能必不可少。这个问题是数据库处理中十分常见的问题。经典的数据分页方法是:ADO纪录集分页法,也就是利用ADO自带的分页功能(利用游标)来实现分页。但这种分页方法仅适用于较小数据量的情形,因为游标本身有缺点:游标是存放在内存中,很费内存。游标一建立,就将相关的记录锁住,直到取消游标。游标提供了对特定集合中逐行扫描的手段,一般使用游标来逐行遍历数据,根据取出数据条件的不同进行不同的操作。而对于多表和大表中定义的游标(大的数据集合)循环很容易使程序进入一个漫长的等待甚至死机。 CREATEprocedurepagination1 (@pagesizeint,--页面大小,如每页存储20条记录 @pageindexint--当前页码 ) as setnocounton begin declare@indextabletable(idintidentity(1,1),nidint)--定义表变量 declare@PageLowerBoundint--定义此页的底码 declare@PageUpperBoundint--定义此页的顶码 set@PageLowerBound=(@pageindex-1)*@pagesize set@PageUpperBound=@PageLowerBound+@pagesize setrowcount@PageUpperBound insertinto@indextable(nid)selectgidfromTGongwen wherefariqi>dateadd(day,-365,getdate())orderbyfariqidesc selectO.gid,O.mid,O.title,O.fadanwei,O.fariqifromTGongwenO,@indextablet whereO.gid=t.nidandt.id>@PageLowerBound andt.id<=@PageUpperBoundorderbyt.id end setnocountoff 以上存储过程运用了SQLSERVER的最新技术――表变量。应该说这个存储过程也是一个非常优秀的分页存储过程。当然,在这个过程中,您也可以把其中的表变量写成临时表:CREATETABLE#Temp。但很明显,在SQLSERVER中,用临时表是没有用表变量快的。所以笔者刚开始使用这个存储过程时,感觉非常的不错,速度也比原来的ADO的好。但后来,我又发现了比此方法更好的方法。 从publish表中取出第n条到第m条的记录: SELECTTOPm-n+1* FROMpublish WHERE(idNOTIN (SELECTTOPn-1id FROMpublish)) id为publish表的关键字 我当时看到这篇文章的时候,真的是精神为之一振,觉得思路非常得好。等到后来,我在作办公自动化系统(ASP.NET+C#+SQLSERVER)的时候,忽然想起了这篇文章,我想如果把这个语句改造一下,这就可能是一个非常好的分页存储过程。于是我就满网上找这篇文章,没想到,文章还没找到,却找到了一篇根据此语句写的一个分页存储过程,这个存储过程也是目前较为流行的一种分页存储过程,我很后悔没有争先把这段文字改造成存储过程: CREATEPROCEDUREpagination2 ( @SQLnVARCHAR(4000),--不带排序语句的SQL语句 @Pageint,--页码 @RecsPerPageint,--每页容纳的记录数 @IDVARCHAR(255),--需要排序的不重复的ID号 @SortVARCHAR(255)--排序字段及规则 ) AS DECLARE@StrnVARCHAR(4000) SET@Str=''SELECTTOP''+CAST(@RecsPerPageASVARCHAR(20))+''*FROM (''+@SQL+'')TWHERET.''+@ID+''NOTIN(SELECTTOP''+CAST((@RecsPerPage*(@Page-1)) ASVARCHAR(20))+''''+@ID+''FROM(''+@SQL+'')T9ORDERBY''+@Sort+'')ORDERBY''+@Sort PRINT@Str EXECsp_ExecuteSql@Str GO 其实,以上语句可以简化为: SELECTTOP页大小* FROMTable1WHERE(IDNOTIN(SELECTTOP页大小*页数idFROM表ORDERBYid)) ORDERBYID 但这个存储过程有一个致命的缺点,就是它含有NOTIN字样。虽然我可以把它改造为: SELECTTOP页大小* FROMTable1WHEREnotexists (select*from(selecttop(页大小*页数)*fromtable1orderbyid)bwhereb.id=a.id) orderbyid 即,用notexists来代替notin,但我们前面已经谈过了,二者的执行效率实际上是没有区别的。既便如此,用TOP结合NOTIN的这个方法还是比用游标要来得快一些。 Selecttop10*fromtable1whereid>200 于是就有了如下分页方案: selecttop页大小* fromtable1 whereid> (selectmax(id)from (selecttop((页码-1)*页大小)idfromtable1orderbyid)asT ) orderbyid 在选择即不重复值,又容易分辨大小的列时,我们通常会选择主键。下表列出了笔者用有着1000万数据的办公自动化系统中的表,在以GID(GID是主键,但并不是聚集索引。)为排序列、提取gid,fariqi,title字段,分别以第1、10、100、500、1000、1万、10万、25万、50万页为例,测试以上三种分页方案的执行速度:(单位:毫秒)
从上表中,我们可以看出,三种存储过程在执行100页以下的分页命令时,都是可以信任的,速度都很好。但第一种方案在执行分页1000页以上后,速度就降了下来。第二种方案大约是在执行分页1万页以上后速度开始降了下来。而第三种方案却始终没有大的降势,后劲仍然很足。 CREATEPROCEDUREpagination3 @tblNamevarchar(255),--表名 @strGetFieldsvarchar(1000)=''*'',--需要返回的列 @fldNamevarchar(255)='''',--排序的字段名 @PageSizeint=10,--页尺寸 @PageIndexint=1,--页码 @doCountbit=0,--返回记录总数,非0值则返回 @OrderTypebit=0,--设置排序类型,非0值则降序 @strWherevarchar(1500)=''''--查询条件(注意:不要加where) AS declare@strSQLvarchar(5000)--主语句 declare@strTmpvarchar(110)--临时变量 declare@strOrdervarchar(400)--排序类型 if@doCount!=0 begin if@strWhere!='''' set@strSQL="selectcount(*)asTotalfrom["+@tblName+"]where"+@strWhere else set@strSQL="selectcount(*)asTotalfrom["+@tblName+"]" end --以上代码的意思是如果@doCount传递过来的不是0,就执行总数统计。以下的所有代码都是@doCount为0的情况: else begin if@OrderType!=0 begin set@strTmp="<(selectmin" set@strOrder="orderby["+@fldName+"]desc" --如果@OrderType不是0,就执行降序,这句很重要! end else begin set@strTmp=">(selectmax" set@strOrder="orderby["+@fldName+"]asc" end if@PageIndex=1 begin if@strWhere!='''' set@strSQL="selecttop"+str(@PageSize)+""+@strGetFields+" from["+@tblName+"]where"+@strWhere+""+@strOrder else set@strSQL="selecttop"+str(@PageSize)+""+@strGetFields+" from["+@tblName+"]"+@strOrder --如果是第一页就执行以上代码,这样会加快执行速度 end else begin --以下代码赋予了@strSQL以真正执行的SQL代码 set@strSQL="selecttop"+str(@PageSize)+""+@strGetFields+"from[" +@tblName+"]where["+@fldName+"]"+@strTmp+"(["+@fldName+"]) from(selecttop"+str((@PageIndex-1)*@PageSize)+"["+@fldName+"] from["+@tblName+"]"+@strOrder+")astblTmp)"+@strOrder if@strWhere!='''' set@strSQL="selecttop"+str(@PageSize)+""+@strGetFields+"from[" +@tblName+"]where["+@fldName+"]"+@strTmp+"([" +@fldName+"])from(selecttop"+str((@PageIndex-1)*@PageSize)+"[" +@fldName+"]from["+@tblName+"]where"+@strWhere+"" +@strOrder+")astblTmp)and"+@strWhere+""+@strOrder end end exec(@strSQL) GO 上面的这个存储过程是一个通用的存储过程,其注释已写在其中了。在大数据量的情况下,特别是在查询最后几页的时候,查询时间一般不会超过9秒;而用其他存储过程,在实践中就会导致超时,所以这个存储过程非常适用于大容量数据库的查询。笔者希望能够通过对以上存储过程的解析,能给大家带来一定的启示,并给工作带来一定的效率提升,同时希望同行提出更优秀的实时数据分页算法。 |