一、 查询要求
Q6语句查询得到某一年中通过变换折扣带来的增量收入。这是典型的"what-if"判断,用来寻找增加收入的途径。预测收入变化查询考虑了指定的一年中折扣在"DISCOUNT-0.01"和"DISCOUNT+0.01 "之间的已运送的所有订单,求解把l_quantity小于quantity的订单的折扣消除之后总收入增加的数量。
Q6语句的特点是:带有聚集操作的单表查询操作。查询语句使用了BETWEEN-AND操作符,有的数据库可以对BETWEEN-AND进行优化。
二、 Oracle执行
Oracle编写的查询SQL语句如下:
select /*+ parallel(n) */
sum(l_extendedprice * l_discount) as revenue
from
lineitem
where
l_shipdate >= date '1995-01-01'
and l_shipdate < date '1995-01-01' + interval '1' year
and l_discount between 0.05 - 0.01 and 0.05 + 0.01
and l_quantity < 24;
其中/*+ parallel(n) */ 是Oracle的并行查询语法,n是并行数。
脚本执行时间,单位:秒
| 并行数 | 1 | 2 | 4 | 8 | 12 |
| Oracle | 328 | 240 | 183 | 154 | 135 |
三、 SPL优化
这是一个常规的过滤后聚合查询,结果集只有一条记录,没有特殊的优化技术,跟Q1一样使用多路游标充分利用并行即可。
SPL脚本如下:
| A | |
| 1 | =1 |
| 2 | =now() |
| 3 | >date=date("1995-01-01") |
| 4 | >discount=0.05 |
| 5 | >quantity=24 |
| 6 | =elapse@y(date,1) |
| 7 | =file(path+"lineitem.ctx").create().cursor@m(L_EXTENDEDPRICE,L_DISCOUNT;L_SHIPDATE>=date && L_SHIPDATE < A6 && L_DISCOUNT >= discount - 0.01 && L_DISCOUNT <= discount + 0.01 && L_QUANTITY < quantity;A1) |
| 8 | =A7.groups(;sum(L_EXTENDEDPRICE*L_DISCOUNT):revenue) |
| 9 | =now() |
| 10 | =interval@s(A2,A9) |
这里也使用了创建游标时即进行数据过滤以减少读取量的技巧(这个技巧在SPL中很常用,后面的例子中都有用到,后文中不再赘述)。
脚本执行时间,单位:秒
| 并行数 | 1 | 2 | 4 | 8 | 12 |
| Oracle | 328 | 240 | 183 | 154 | 135 |
| SPL组表 | 110 | 58 | 34 | 21 | 12 |
因为数据量比较大,组表的列存优势比较明显。
本文探讨了在处理大规模数据时,SQL与SPL在查询性能上的差异。通过对某一年中通过变换折扣带来的增量收入这一典型what-if场景的查询,展示了不同并行数下Oracle SQL与SPL的执行效率。结果显示,在数据量较大时,SPL利用其组表的列存优势,表现出更佳的性能。
686

被折叠的 条评论
为什么被折叠?



