1. 案例起因
公司门店应用程序每天都要出一份报表,用来统计所有商品当天的期初库存数量、入库数量、出库数量 及当天的期末库存数量。运行半年以后,这份报表运行越来越慢,到现在,每次运行该报表显示当天数据时需要近20秒的时间。于是开发人员找到我,希望我看看,是不是可以使该报表运行的时间更短。 该报表就是一段SQL语句,主要由三部分组成,第一部分是计算每个商品的期初数量,第二部分是计算每个商品的当天发生(包括入库和出库的)数量,第三部分是计算每个商品的期末数量,也就是当天的余额。每个部分使用UNION ALL连接起来。 我看到该报表,第一个感觉就是这段SQL里的每个部分都要对表进行扫描,明显成本过高。应该可以使用WITH AS进行改写。 2. WITH AS的含义 WITH AS短语,也叫做子查询部分(subquery factoring),可以让你做很多事情,定义一个SQL片断,该SQL片断会被整个SQL语句所用到。有的时候,是为了让SQL语句的可读性更高些,也有可能是在UNION ALL的不同部分,作为提供数据的部分。 特别对于UNION ALL比较有用。因为UNION ALL的每个部分可能相同,但是如果每个部分都去执行一遍的话,则成本太高,所以可以使用WITH AS短语,则只要执行一遍即可。如果WITH AS短语所定义的表名被调用两次以上,则优化器会自动将WITH AS短语所获取的数据放入一个TEMP表里,如果只是被调用一次,则不会。而提示materialize则是强制将WITH AS短语里的数据放入一个全局临时表里。很多查询通过这种方法都可以提高速度。 3. 案例说明 首先介绍该SQL所涉及到的主要的表的结构。该表表名为fin,用来存放每天每个商品的发生数以及该商 品的余额数。其表结构为如下所示(这里我只选取了与我们要讨论的SQL相关的部分表字段)。 SQL> desc fin 名称 是否为空? 类型 ----------------------------------------- -------- ---------------------------- 。。。。。。 DAY DATE SKU VARCHAR2(8) INQTY NUMBER(16,6) OUTQTY NUMBER(16,6) LASTQTY NUMBER(16,6) 。。。。。。。。 简单解释一下各个字段的含义: 1) DAY:发生的日期。 2) SKU:发生交易的商品代码。 3) INQTY:商品入库数量。 4) OUTQTY:商品出库数量。 5) LASTQTY:商品的余额数量。 该表中含有的记录数量为: SQL> SELECT count(*) FROM fin; COUNT(*) ---------- 4729319 原来的SQL如下所示(比如查询2003年7月14日这天的记录。当然,我对该SQL做了些修改,去掉了与本文讨论无关的部分,比如显示商品名称之类的部分等): SELECT sku, sum(initqty) as initqty, sum(inqty) as inqty,sum(outqty) as outqty, sum(lastqty) as lastqty FROM ( SELECT sku,lastqty as initqty,0 as inqty,0 as outqty,0 as lastqty FROM fin WHERE day=to_date('20030713','yyyymmdd') UNION ALL SELECT sku,0 as initqty,inqty,outqty,0 as lastqty FROM fin WHERE day>=to_date('20030714','yyyymmdd') and day<=to_date('20030714','yyyymmdd') UNION ALL SELECT sku,0 as initqty,0 as inqty,0 as outqty,lastqty FROM fin WHERE day=to_date('20030714','yyyymmdd') ) GROUP BY sku; 我们来看该SQL所花费的时间为: SQL> set timing on SQL> / 。。。。。。。。。。。。。。。。。。。。。。。。。。。。。 SKU INITQTY INQTY OUTQTY LASTQTY -------- ---------- ---------- ---------- ---------- 00106162 0 0 12 60 00106467 0 20 10 60 已选择956行。 已用时间: 00: 00: 19.08 然后,我们来对该SQL进行改写一番,如下所示: WITH result AS ( SELECT /*+ materialize */ day,sku,inqty,outqty,lastqty FROM fin WHERE day>=to_date('20030713','yyyymmdd') AND day<=to_date('20030714','yyyymmdd')) SELECT sku, sum(initqty) as initqty, sum(inqty) as inqty, sum(outqty) as outqty, sum(lastqty) as lastqty FROM ( SELECT sku,lastqty as initqty,0 as inqty,0 as outqty,0 as lastqty FROM result WHERE day=to_date('20030713','yyyymmdd') UNION ALL SELECT sku,0 as initqty,inqty,outqty,0 as lastqty FROM result WHERE day=to_date('20030714','yyyymmdd') UNION ALL SELECT sku,0 as initqty,0 as inqty,0 as outqty,lastqty FROM result WHERE day=to_date('20030714','yyyymmdd') ) GROUP BY sku; 我们来看修改后的SQL所花费的时间为: SQL> set timing on SQL> / 。。。。。。。。。。。。。。。。。。。。。。。。。。。。。 SKU INITQTY INQTY OUTQTY LASTQTY -------- ---------- ---------- ---------- ---------- 00106162 0 0 12 60 00106467 0 20 10 60 已选择956行。 已用时间: 00: 00: 06.06 从这里可以看到,通过WITH AS可以从20秒降低到6秒,几乎提高了65%的性能。 |